קודם לכן, דנו כיצד אנו יכולים [להפוך את הניתוח לאוטומטי ולסווג מסמכים שלמים באופן פרוגרמטי2. לעתים קרובות נדרש לסווג רק חלק מהמסמך או רק כמה הצהרות. במאמר זה נזהה את הקטגוריות הטקסונומיות הטובות ביותר של הטקסט הנבחר. נלמד כיצד נוכל לסווג טקסט לפי IAB-2 ולתעד טקסונומיות באמצעות C#.

הנושאים הבאים מכוסים להלן:

.NET API לסיווג טקסונומי של טקסט

GroupDocs.Classification for .NET הוא ה-API המאפשר טכניקות שונות לסיווג תוכן טקסט בתוך יישומי NET. אנו נשתמש ב-API זה כדי למצוא את הקטגוריות הטקסונומיות הטובות ביותר האפשריות של הטקסט שסופק באמצעות C# בדוגמאות.

אתה יכול להוריד את קובצי ה-DLL או ה-MSI מתקין מסעיף ההורדות או להתקין את ה-API באפליקציית NET שלך דרך NuGet.

PM> Install-Package GroupDocs.Classification

סיווג טקסט עם טקסונומיה של IAB-2 באמצעות C#

IAB-2 מסווג את התוכן ל קטגוריות טקסונומיות מוגדרות ולאחר מכן מסווג אותו על סמך הניתוח. להלן השלבים לסיווג טקסונומי של טקסט עם טקסונומיה IAB-2 באמצעות C#.

  • הצג את המסווג באמצעות המחלקה מסווג.
  • הגדר את הטקסט לניתוח טקסונומי.
  • הגדר את טקסונומיה כ-IAB2.
  • הגדר את מספר התוצאות הטובות ביותר כתוצאה מהסיווג. (אופציונאלי)
  • קבל את הקטגוריות הטקסונומיות של הטקסט שסופק על ידי קריאה לשיטת Classify עם הפרמטרים המוגדרים.
  • הדפס את BestResults מתוך תגובת הסיווג של שיטת הסיווג.

קוד המקור C# הבא מראה כיצד לסווג טקסט באמצעות טקסונומיה של IAB-2 ולקבל את הקטגוריות המובילות עם ההתאמה הטובה ביותר.

/*
* סיווג טקסט עם IAB-2 Taxonomy באמצעות C#
*/
Classifier classifier = new Classifier();
string statement = "Medicine is an important part of our lives";

var response = classifier.Classify(statement, 3, Taxonomy.Iab2);
response.BestResults.ToList().ForEach(bestResult => Console.WriteLine($"Class: {bestResult.Name}, \tProbability: {bestResult.Probability}"));
 Class: Healthy\_Living,      Probability: 0.4144087
 Class: Medical\_Health,     Probability: 0.2108202
 Class: Science,                 Probability: 0.1584931

סיווג טקסט עם טקסונומיה של מסמכים באמצעות C#

טקסונומיה של מסמכים מסווגת את התוכן לסוגי מסמכים, כגון פרסומות, חשבוניות, חדשות, קורות חיים, מכתבים, מיילים וכו’. להלן השלבים לסיווג טקסונומי של טקסט עם טקסונומיה של מסמכים באמצעות C#.

  • הצג את מסווג.
  • טען את הטקסט לניתוח טקסונומי.
  • הגדר את מספר התוצאות הטובות ביותר כתוצאה מהסיווג. (אופציונאלי)
  • הגדר את טקסונומיה כמסמכים.
  • קבל את הקבוצות הטקסונומיות על ידי קריאה לשיטת Classify עם הפרמטרים שהוגדרו לעיל.
  • הדפס את BestResults מתוך תגובת הסיווג של שיטת הסיווג.

קוד המקור הבא של C# מראה כיצד לסווג תוכן טקסט ולקבל כמה מהקטגוריות הטקסונומיות המובילות שלו באמצעות טקסונומיה של מסמכים.

/*
* סיווג טקסט עם טקסונומיה של מסמכים באמצעות C#
*/
Classifier classifier = new Classifier();
string statement = "Sooner or later technology will overcome labor work";

var response = classifier.Classify(statement, 2, Taxonomy.Documents);
response.BestResults.ToList().ForEach(bestResult => Console.WriteLine($"Class: {bestResult.Name}, \tProbability: {bestResult.Probability}"));
 Class: ADVE,      Probability: 0.9999645
 Class: Report,     Probability: 3.461805E-05

קבל רישיון חינם

אתה יכול לקבל רישיון זמני בחינם על מנת להשתמש ב-API ללא מגבלות ההערכה.

סיכום

לסיכום, למדנו לסווג סוגים שונים של מסמכים באמצעות טקסונומיות שונות. בדוגמאות, סיווגנו את הטקסט לפי IAB-2 ואת הטקסונומיות של המסמכים באמצעות C#. לאחר שעוברים על סדרת הפוסטים, תוכלו לבנות אפליקציית סיווג .NET משלכם כדי לסווג מסמכים כמו גם טקסט עם טקסונומיות ותצורות שונות.

למידע נוסף על ה-API, בקר בתיעוד. לשאלות, צור איתנו קשר דרך הפורום.

ראה גם