ناقشنا سابقًا كيف يمكننا أتمتة التحليل وتصنيف المستندات الكاملة برمجيًا. غالبًا ما يكون مطلوبًا تصنيف جزء من المستند فقط أو بعض العبارات فقط. في هذه المقالة ، سوف نحدد أفضل الفئات التصنيفية الممكنة للنص المحدد. سنتعلم كيف يمكننا تصنيف النص وفقًا لـ IAB-2 وتصنيفات المستندات باستخدام C #.

يتم تناول الموضوعات التالية أدناه:

.NET API للتصنيف التصنيفي للنص

GroupDocs.Classification for .NET هي واجهة برمجة التطبيقات التي تسمح بتقنيات مختلفة لتصنيف محتوى النص داخل تطبيقات .NET. سنستخدم واجهة برمجة التطبيقات هذه للعثور على أفضل الفئات التصنيفية الممكنة للنص المقدم باستخدام C # في الأمثلة.

يمكنك تنزيل مثبت DLL أو MSI من قسم التنزيلات أو تثبيت API في تطبيق .NET عبر NuGet.

PM> Install-Package GroupDocs.Classification

تصنيف النص باستخدام تصنيف IAB-2 باستخدام C

يصنف IAB-2 المحتوى إلى [فئات تصنيفية] محددة 9 ثم يصنفه بناءً على التحليل. فيما يلي خطوات التصنيف التصنيفي للنص باستخدام IAB-2 التصنيف باستخدام C #.

  • مثيل المصنف باستخدام فئة مصنف.
  • حدد النص للتحليل التصنيفي.
  • قم بتعيين التصنيف كـ IAB2.
  • قم بتعيين عدد أفضل النتائج حسب نتيجة التصنيف. (اختياري)
  • احصل على الفئات التصنيفية للنص المقدم عن طريق استدعاء طريقة Classify بالمعلمات المحددة.
  • اطبع BestResults من استجابة التصنيف لطريقة التصنيف.

يوضح الكود المصدري C # التالي كيفية تصنيف النص باستخدام تصنيف IAB-2 والحصول على أفضل الفئات بأفضل تطابق.

/*
* تصنيف النص باستخدام تصنيف IAB-2 باستخدام C #
*/
Classifier classifier = new Classifier();
string statement = "Medicine is an important part of our lives";

var response = classifier.Classify(statement, 3, Taxonomy.Iab2);
response.BestResults.ToList().ForEach(bestResult => Console.WriteLine($"Class: {bestResult.Name}, \tProbability: {bestResult.Probability}"));
 Class: Healthy\_Living,      Probability: 0.4144087
 Class: Medical\_Health,     Probability: 0.2108202
 Class: Science,                 Probability: 0.1584931

تصنيف النص مع تصنيف المستندات باستخدام C

يصنف تصنيف المستندات المحتوى إلى [فئات مستندات] مختلفة 16 ، مثل الإعلانات والفواتير والأخبار والسيرة الذاتية والخطابات ورسائل البريد الإلكتروني وما إلى ذلك. فيما يلي خطوات التصنيف التصنيفي للنص مع تصنيف المستندات باستخدام C #.

  • إنشاء مثيل مصنف.
  • قم بتحميل النص للتحليل التصنيفي.
  • تحديد عدد أفضل النتائج التي يتم حسابها نتيجة التصنيف. (اختياري)
  • قم بتعيين التصنيف كوثائق.
  • احصل على المجموعات التصنيفية عن طريق استدعاء طريقة Classify بالمعلمات المحددة أعلاه.
  • اطبع BestResults من استجابة التصنيف لطريقة التصنيف.

يوضح الكود المصدري C # التالي كيفية تصنيف محتوى النص والحصول على بعض من أفضل الفئات التصنيفية باستخدام تصنيف المستندات.

/*
* تصنيف النص باستخدام تصنيف المستندات باستخدام C #
*/
Classifier classifier = new Classifier();
string statement = "Sooner or later technology will overcome labor work";

var response = classifier.Classify(statement, 2, Taxonomy.Documents);
response.BestResults.ToList().ForEach(bestResult => Console.WriteLine($"Class: {bestResult.Name}, \tProbability: {bestResult.Probability}"));
 Class: ADVE,      Probability: 0.9999645
 Class: Report,     Probability: 3.461805E-05

احصل على رخصة مجانية

يمكنك الحصول على ترخيص مؤقت مجاني من أجل استخدام واجهة برمجة التطبيقات بدون قيود التقييم.

استنتاج

باختصار ، تعلمنا تصنيف أنواع مختلفة من المستندات باستخدام تصنيفات مختلفة. في الأمثلة ، قمنا بتصنيف النص وفقًا لـ IAB-2 وتصنيفات المستندات باستخدام C #. بعد الاطلاع على سلسلة المنشورات ، يمكنك إنشاء تطبيق تصنيف .NET الخاص بك لـ تصنيف المستندات بالإضافة إلى نص به تصنيفات وتكوينات مختلفة.

لمزيد من المعلومات حول API ، قم بزيارة التوثيق. للاستفسارات ، اتصل بنا عبر المنتدى.

أنظر أيضا