ก่อนหน้านี้ เราได้พูดถึงวิธีที่เราสามารถ [ทำการวิเคราะห์และจัดประเภทเอกสารที่สมบูรณ์โดยอัตโนมัติโดยทางโปรแกรม] ได้อย่างไร2 บ่อยครั้งที่จำเป็นต้องจำแนกเอกสารเพียงบางส่วนหรือเพียงบางส่วนเท่านั้น ในบทความนี้ เราจะระบุหมวดหมู่อนุกรมวิธานที่ดีที่สุดที่เป็นไปได้ของข้อความที่เลือก เราจะเรียนรู้วิธีจำแนกข้อความตาม IAB-2 และจัดหมวดหมู่เอกสารโดยใช้ C#

หัวข้อต่อไปนี้ครอบคลุมด้านล่าง:

.NET API สำหรับการจำแนกประเภทข้อความ

GroupDocs.Classification for .NET เป็น API ที่อนุญาตให้ใช้เทคนิคต่างๆ ในการจำแนกเนื้อหาข้อความภายในแอปพลิเคชัน .NET เราจะใช้ API นี้เพื่อค้นหาหมวดหมู่อนุกรมวิธานที่ดีที่สุดที่เป็นไปได้ของข้อความที่ระบุโดยใช้ C# ในตัวอย่าง

คุณสามารถดาวน์โหลดโปรแกรมติดตั้ง DLLs หรือ MSI ได้จาก ส่วนการดาวน์โหลด หรือติดตั้ง API ในแอปพลิเคชัน .NET ของคุณผ่านทาง NuGet

PM> Install-Package GroupDocs.Classification

การจัดประเภทข้อความด้วย IAB-2 Taxonomy โดยใช้ C#

IAB-2 จัดหมวดหมู่เนื้อหาเป็น หมวดหมู่อนุกรมวิธาน ที่กำหนดไว้ จากนั้นจัดประเภทตามการวิเคราะห์ ต่อไปนี้เป็นขั้นตอนสำหรับการจัดประเภทข้อความตามอนุกรมวิธานด้วย IAB-2 taxonomy โดยใช้ C#

  • ยกตัวอย่างลักษณนามโดยใช้คลาส Classifier
  • กำหนดข้อความสำหรับการวิเคราะห์อนุกรมวิธาน
  • ตั้งค่า Taxonomy เป็น IAB2
  • กำหนดจำนวนผลลัพธ์ที่ดีที่สุดซึ่งนับเป็นผลลัพธ์ของการจัดประเภท (ไม่จำเป็น)
  • รับหมวดหมู่อนุกรมวิธานของข้อความที่ระบุโดยเรียกเมธอด Classify ด้วยพารามิเตอร์ที่กำหนด
  • พิมพ์ BestResults จาก การตอบสนองการจัดหมวดหมู่ ของเมธอด Classify

ซอร์สโค้ด C# ต่อไปนี้แสดงวิธีจัดประเภทข้อความโดยใช้อนุกรมวิธาน IAB-2 และรับหมวดหมู่สูงสุดที่ตรงกันที่สุด

/*
* จัดประเภทข้อความด้วย IAB-2 Taxonomy โดยใช้ C#
*/
Classifier classifier = new Classifier();
string statement = "Medicine is an important part of our lives";

var response = classifier.Classify(statement, 3, Taxonomy.Iab2);
response.BestResults.ToList().ForEach(bestResult => Console.WriteLine($"Class: {bestResult.Name}, \tProbability: {bestResult.Probability}"));
 Class: Healthy\_Living,      Probability: 0.4144087
 Class: Medical\_Health,     Probability: 0.2108202
 Class: Science,                 Probability: 0.1584931

การจัดหมวดหมู่ข้อความด้วย Document Taxonomy โดยใช้ C#

การจัดหมวดหมู่เอกสารจำแนกเนื้อหาออกเป็น คลาสเอกสาร ต่างๆ เช่น โฆษณา ใบแจ้งหนี้ ข่าว ประวัติย่อ จดหมาย อีเมล ฯลฯ ต่อไปนี้เป็นขั้นตอนสำหรับการจำแนกการจัดหมวดหมู่ข้อความด้วยการจัดหมวดหมู่เอกสารโดยใช้ C#

  • ยกตัวอย่าง Classifier
  • โหลดข้อความสำหรับการวิเคราะห์อนุกรมวิธาน
  • กำหนดจำนวนผลลัพธ์ที่ดีที่สุดซึ่งนับเป็นผลลัพธ์ของการจัดประเภท (ไม่จำเป็น)
  • ตั้งค่า Taxonomy เป็นเอกสาร
  • รับกลุ่มอนุกรมวิธานโดยเรียกเมธอด Classify ด้วยพารามิเตอร์ที่กำหนดไว้ข้างต้น
  • พิมพ์ BestResults จาก การตอบสนองการจัดประเภท ของเมธอด Classify

ซอร์สโค้ด C# ต่อไปนี้แสดงวิธีจัดประเภทเนื้อหาข้อความและรับหมวดหมู่อนุกรมวิธานชั้นนำบางส่วนโดยใช้อนุกรมวิธานเอกสาร

/*
* จำแนกข้อความด้วย Document Taxonomy โดยใช้ C#
*/
Classifier classifier = new Classifier();
string statement = "Sooner or later technology will overcome labor work";

var response = classifier.Classify(statement, 2, Taxonomy.Documents);
response.BestResults.ToList().ForEach(bestResult => Console.WriteLine($"Class: {bestResult.Name}, \tProbability: {bestResult.Probability}"));
 Class: ADVE,      Probability: 0.9999645
 Class: Report,     Probability: 3.461805E-05

รับใบอนุญาตฟรี

คุณสามารถ รับใบอนุญาตชั่วคราวได้ฟรี เพื่อใช้ API โดยไม่มีข้อจำกัดในการประเมิน

บทสรุป

โดยสรุป เราได้เรียนรู้การจัดประเภทเอกสารประเภทต่างๆ โดยใช้อนุกรมวิธานที่แตกต่างกัน ในตัวอย่าง เราจัดประเภทข้อความตาม IAB-2 และการจัดหมวดหมู่เอกสารโดยใช้ C# หลังจากอ่านบทความต่างๆ แล้ว คุณสามารถสร้างแอปพลิเคชันการจำแนกประเภท .NET ของคุณเองเพื่อ จัดประเภทเอกสาร รวมถึงข้อความที่มีอนุกรมวิธานและการกำหนดค่าต่างกัน

สำหรับข้อมูลเพิ่มเติมเกี่ยวกับ API โปรดไปที่ เอกสารประกอบ สำหรับข้อสงสัย ติดต่อเราผ่านทาง ฟอรัม

ดูสิ่งนี้ด้วย