قبلاً، ما در مورد اینکه چگونه می‌توانیم [تحلیل را خودکار کنیم و اسناد کامل را به صورت برنامه‌ریزی طبقه‌بندی کنیم2 بحث کردیم. اغلب لازم است که فقط بخشی از سند یا فقط چند عبارت طبقه بندی شود. در این مقاله بهترین دسته بندی های ممکن از متن انتخاب شده را شناسایی می کنیم. ما یاد خواهیم گرفت که چگونه می توانیم متن را بر اساس IAB-2 و طبقه بندی اسناد با استفاده از C# طبقه بندی کنیم.

موضوعات زیر در زیر پوشش داده شده است:

NET API برای طبقه بندی تاکسونومیک متن

GroupDocs.Classification for.NET API است که تکنیک های مختلفی را برای طبقه بندی محتوای متنی در برنامه های NET امکان پذیر می کند. ما از این API برای یافتن بهترین دسته بندی های ممکن از متن ارائه شده با استفاده از C# در مثال ها استفاده خواهیم کرد.

می توانید نصب کننده DLL یا MSI را از بخش دانلودها دانلود کنید یا از طریق NuGet API را در برنامه .NET خود نصب کنید.

PM> Install-Package GroupDocs.Classification

طبقه بندی متن با تاکسونومی IAB-2 با استفاده از C#

IAB-2 محتوا را به [دسته‌های طبقه‌بندی9 تعریف شده دسته‌بندی می‌کند و سپس آن را بر اساس تجزیه و تحلیل طبقه‌بندی می‌کند. در زیر مراحل طبقه‌بندی تاکسونومیک متن با طبقه‌بندی IAB-2 با استفاده از C# آمده است.

  • طبقه‌بندی‌کننده را با استفاده از کلاس Classifier نمونه‌سازی کنید.
  • متن را برای تحلیل طبقه بندی تعریف کنید.
  • Taxonomy را به عنوان IAB2 تنظیم کنید.
  • تعداد بهترین نتایج را در نتیجه طبقه بندی تنظیم کنید. (اختیاری)
  • با فراخوانی روش Classify با پارامترهای تعریف شده، دسته بندی های طبقه بندی متن ارائه شده را دریافت کنید.
  • BestResults را از Classification Results از روش Classify چاپ کنید.

کد منبع C# زیر نحوه طبقه‌بندی متن با استفاده از طبقه‌بندی IAB-2 و دریافت دسته‌های برتر با بهترین تطابق را نشان می‌دهد.

/*
* طبقه بندی متن با تاکسونومی IAB-2 با استفاده از C#
*/
Classifier classifier = new Classifier();
string statement = "Medicine is an important part of our lives";

var response = classifier.Classify(statement, 3, Taxonomy.Iab2);
response.BestResults.ToList().ForEach(bestResult => Console.WriteLine($"Class: {bestResult.Name}, \tProbability: {bestResult.Probability}"));
 Class: Healthy\_Living,      Probability: 0.4144087
 Class: Medical\_Health,     Probability: 0.2108202
 Class: Science,                 Probability: 0.1584931

طبقه بندی متن با تاکسونومی اسناد با استفاده از C#

طبقه‌بندی اسناد، محتوا را به [کلاس‌های سند16 مختلف طبقه‌بندی می‌کند، مانند تبلیغات، فاکتورها، اخبار، رزومه، نامه‌ها، ایمیل‌ها و غیره.

  • Classifier را نمونه‌سازی کنید.
  • متن را برای تجزیه و تحلیل طبقه بندی بارگذاری کنید.
  • تعداد بهترین نتایج را در نتیجه طبقه بندی تعریف کنید. (اختیاری)
  • Taxonomy را به عنوان اسناد تنظیم کنید.
  • با فراخوانی روش Classify با پارامترهای تعریف شده در بالا، گروه‌های طبقه‌بندی را دریافت کنید.
  • BestResults را از classification response روش Classify چاپ کنید.

کد منبع C# زیر نحوه طبقه بندی محتوای متن و دریافت برخی از دسته بندی های برتر آن را با استفاده از طبقه بندی اسناد نشان می دهد.

/*
* طبقه بندی متن با طبقه بندی اسناد با استفاده از سی شارپ
*/
Classifier classifier = new Classifier();
string statement = "Sooner or later technology will overcome labor work";

var response = classifier.Classify(statement, 2, Taxonomy.Documents);
response.BestResults.ToList().ForEach(bestResult => Console.WriteLine($"Class: {bestResult.Name}, \tProbability: {bestResult.Probability}"));
 Class: ADVE,      Probability: 0.9999645
 Class: Report,     Probability: 3.461805E-05

مجوز رایگان دریافت کنید

برای استفاده از API بدون محدودیت ارزیابی، می توانید یک مجوز موقت رایگان دریافت کنید.

نتیجه

به طور خلاصه، ما یاد گرفتیم که انواع مختلف اسناد را با استفاده از طبقه بندی های مختلف طبقه بندی کنیم. در مثال‌ها، متن را طبق IAB-2 و طبقه‌بندی اسناد با استفاده از C# طبقه‌بندی کردیم. پس از گذراندن یک سری پست‌ها، می‌توانید برنامه طبقه‌بندی دات‌نت خود را برای طبقه‌بندی اسناد و همچنین متنی با طبقه‌بندی و پیکربندی‌های مختلف بسازید.

برای اطلاعات بیشتر در مورد API، به مستندات مراجعه کنید. برای سؤالات، از طریق [فروم 25 با ما تماس بگیرید.

همچنین ببینید