قبلاً، ما در مورد اینکه چگونه میتوانیم [تحلیل را خودکار کنیم و اسناد کامل را به صورت برنامهریزی طبقهبندی کنیم2 بحث کردیم. اغلب لازم است که فقط بخشی از سند یا فقط چند عبارت طبقه بندی شود. در این مقاله بهترین دسته بندی های ممکن از متن انتخاب شده را شناسایی می کنیم. ما یاد خواهیم گرفت که چگونه می توانیم متن را بر اساس IAB-2 و طبقه بندی اسناد با استفاده از C# طبقه بندی کنیم.
موضوعات زیر در زیر پوشش داده شده است:
- NET API برای طبقه بندی تاکسونومیک متن
- طبقه بندی متن با تاکسونومی IAB-2 با استفاده از C#
- طبقه بندی متن با تاکسونومی اسناد با استفاده از سی شارپ
NET API برای طبقه بندی تاکسونومیک متن
GroupDocs.Classification for.NET API است که تکنیک های مختلفی را برای طبقه بندی محتوای متنی در برنامه های NET امکان پذیر می کند. ما از این API برای یافتن بهترین دسته بندی های ممکن از متن ارائه شده با استفاده از C# در مثال ها استفاده خواهیم کرد.
می توانید نصب کننده DLL یا MSI را از بخش دانلودها دانلود کنید یا از طریق NuGet API را در برنامه .NET خود نصب کنید.
PM> Install-Package GroupDocs.Classification
طبقه بندی متن با تاکسونومی IAB-2 با استفاده از C#
IAB-2 محتوا را به [دستههای طبقهبندی9 تعریف شده دستهبندی میکند و سپس آن را بر اساس تجزیه و تحلیل طبقهبندی میکند. در زیر مراحل طبقهبندی تاکسونومیک متن با طبقهبندی IAB-2 با استفاده از C# آمده است.
- طبقهبندیکننده را با استفاده از کلاس Classifier نمونهسازی کنید.
- متن را برای تحلیل طبقه بندی تعریف کنید.
- Taxonomy را به عنوان IAB2 تنظیم کنید.
- تعداد بهترین نتایج را در نتیجه طبقه بندی تنظیم کنید. (اختیاری)
- با فراخوانی روش Classify با پارامترهای تعریف شده، دسته بندی های طبقه بندی متن ارائه شده را دریافت کنید.
- BestResults را از Classification Results از روش Classify چاپ کنید.
کد منبع C# زیر نحوه طبقهبندی متن با استفاده از طبقهبندی IAB-2 و دریافت دستههای برتر با بهترین تطابق را نشان میدهد.
/*
* طبقه بندی متن با تاکسونومی IAB-2 با استفاده از C#
*/
Classifier classifier = new Classifier();
string statement = "Medicine is an important part of our lives";
var response = classifier.Classify(statement, 3, Taxonomy.Iab2);
response.BestResults.ToList().ForEach(bestResult => Console.WriteLine($"Class: {bestResult.Name}, \tProbability: {bestResult.Probability}"));
Class: Healthy\_Living, Probability: 0.4144087
Class: Medical\_Health, Probability: 0.2108202
Class: Science, Probability: 0.1584931
طبقه بندی متن با تاکسونومی اسناد با استفاده از C#
طبقهبندی اسناد، محتوا را به [کلاسهای سند16 مختلف طبقهبندی میکند، مانند تبلیغات، فاکتورها، اخبار، رزومه، نامهها، ایمیلها و غیره.
- Classifier را نمونهسازی کنید.
- متن را برای تجزیه و تحلیل طبقه بندی بارگذاری کنید.
- تعداد بهترین نتایج را در نتیجه طبقه بندی تعریف کنید. (اختیاری)
- Taxonomy را به عنوان اسناد تنظیم کنید.
- با فراخوانی روش Classify با پارامترهای تعریف شده در بالا، گروههای طبقهبندی را دریافت کنید.
- BestResults را از classification response روش Classify چاپ کنید.
کد منبع C# زیر نحوه طبقه بندی محتوای متن و دریافت برخی از دسته بندی های برتر آن را با استفاده از طبقه بندی اسناد نشان می دهد.
/*
* طبقه بندی متن با طبقه بندی اسناد با استفاده از سی شارپ
*/
Classifier classifier = new Classifier();
string statement = "Sooner or later technology will overcome labor work";
var response = classifier.Classify(statement, 2, Taxonomy.Documents);
response.BestResults.ToList().ForEach(bestResult => Console.WriteLine($"Class: {bestResult.Name}, \tProbability: {bestResult.Probability}"));
Class: ADVE, Probability: 0.9999645
Class: Report, Probability: 3.461805E-05
مجوز رایگان دریافت کنید
برای استفاده از API بدون محدودیت ارزیابی، می توانید یک مجوز موقت رایگان دریافت کنید.
نتیجه
به طور خلاصه، ما یاد گرفتیم که انواع مختلف اسناد را با استفاده از طبقه بندی های مختلف طبقه بندی کنیم. در مثالها، متن را طبق IAB-2 و طبقهبندی اسناد با استفاده از C# طبقهبندی کردیم. پس از گذراندن یک سری پستها، میتوانید برنامه طبقهبندی داتنت خود را برای طبقهبندی اسناد و همچنین متنی با طبقهبندی و پیکربندیهای مختلف بسازید.
برای اطلاعات بیشتر در مورد API، به مستندات مراجعه کنید. برای سؤالات، از طریق [فروم 25 با ما تماس بگیرید.