ก่อนหน้านี้ เราได้พูดถึงวิธีที่เราสามารถ [ทำการวิเคราะห์และจัดประเภทเอกสารที่สมบูรณ์โดยอัตโนมัติโดยทางโปรแกรม] ได้อย่างไร2 บ่อยครั้งที่จำเป็นต้องจำแนกเอกสารเพียงบางส่วนหรือเพียงบางส่วนเท่านั้น ในบทความนี้ เราจะระบุหมวดหมู่อนุกรมวิธานที่ดีที่สุดที่เป็นไปได้ของข้อความที่เลือก เราจะเรียนรู้วิธีจำแนกข้อความตาม IAB-2 และจัดหมวดหมู่เอกสารโดยใช้ C#
หัวข้อต่อไปนี้ครอบคลุมด้านล่าง:
- .NET API สำหรับการจำแนกประเภทข้อความ
- การจัดประเภทข้อความด้วย IAB-2 Taxonomy โดยใช้ C#
- การจัดหมวดหมู่ข้อความด้วย Document Taxonomy โดยใช้ C#
.NET API สำหรับการจำแนกประเภทข้อความ
GroupDocs.Classification for .NET เป็น API ที่อนุญาตให้ใช้เทคนิคต่างๆ ในการจำแนกเนื้อหาข้อความภายในแอปพลิเคชัน .NET เราจะใช้ API นี้เพื่อค้นหาหมวดหมู่อนุกรมวิธานที่ดีที่สุดที่เป็นไปได้ของข้อความที่ระบุโดยใช้ C# ในตัวอย่าง
คุณสามารถดาวน์โหลดโปรแกรมติดตั้ง DLLs หรือ MSI ได้จาก ส่วนการดาวน์โหลด หรือติดตั้ง API ในแอปพลิเคชัน .NET ของคุณผ่านทาง NuGet
PM> Install-Package GroupDocs.Classification
การจัดประเภทข้อความด้วย IAB-2 Taxonomy โดยใช้ C#
IAB-2 จัดหมวดหมู่เนื้อหาเป็น หมวดหมู่อนุกรมวิธาน ที่กำหนดไว้ จากนั้นจัดประเภทตามการวิเคราะห์ ต่อไปนี้เป็นขั้นตอนสำหรับการจัดประเภทข้อความตามอนุกรมวิธานด้วย IAB-2 taxonomy โดยใช้ C#
- ยกตัวอย่างลักษณนามโดยใช้คลาส Classifier
- กำหนดข้อความสำหรับการวิเคราะห์อนุกรมวิธาน
- ตั้งค่า Taxonomy เป็น IAB2
- กำหนดจำนวนผลลัพธ์ที่ดีที่สุดซึ่งนับเป็นผลลัพธ์ของการจัดประเภท (ไม่จำเป็น)
- รับหมวดหมู่อนุกรมวิธานของข้อความที่ระบุโดยเรียกเมธอด Classify ด้วยพารามิเตอร์ที่กำหนด
- พิมพ์ BestResults จาก การตอบสนองการจัดหมวดหมู่ ของเมธอด Classify
ซอร์สโค้ด C# ต่อไปนี้แสดงวิธีจัดประเภทข้อความโดยใช้อนุกรมวิธาน IAB-2 และรับหมวดหมู่สูงสุดที่ตรงกันที่สุด
/*
* จัดประเภทข้อความด้วย IAB-2 Taxonomy โดยใช้ C#
*/
Classifier classifier = new Classifier();
string statement = "Medicine is an important part of our lives";
var response = classifier.Classify(statement, 3, Taxonomy.Iab2);
response.BestResults.ToList().ForEach(bestResult => Console.WriteLine($"Class: {bestResult.Name}, \tProbability: {bestResult.Probability}"));
Class: Healthy\_Living, Probability: 0.4144087
Class: Medical\_Health, Probability: 0.2108202
Class: Science, Probability: 0.1584931
การจัดหมวดหมู่ข้อความด้วย Document Taxonomy โดยใช้ C#
การจัดหมวดหมู่เอกสารจำแนกเนื้อหาออกเป็น คลาสเอกสาร ต่างๆ เช่น โฆษณา ใบแจ้งหนี้ ข่าว ประวัติย่อ จดหมาย อีเมล ฯลฯ ต่อไปนี้เป็นขั้นตอนสำหรับการจำแนกการจัดหมวดหมู่ข้อความด้วยการจัดหมวดหมู่เอกสารโดยใช้ C#
- ยกตัวอย่าง Classifier
- โหลดข้อความสำหรับการวิเคราะห์อนุกรมวิธาน
- กำหนดจำนวนผลลัพธ์ที่ดีที่สุดซึ่งนับเป็นผลลัพธ์ของการจัดประเภท (ไม่จำเป็น)
- ตั้งค่า Taxonomy เป็นเอกสาร
- รับกลุ่มอนุกรมวิธานโดยเรียกเมธอด Classify ด้วยพารามิเตอร์ที่กำหนดไว้ข้างต้น
- พิมพ์ BestResults จาก การตอบสนองการจัดประเภท ของเมธอด Classify
ซอร์สโค้ด C# ต่อไปนี้แสดงวิธีจัดประเภทเนื้อหาข้อความและรับหมวดหมู่อนุกรมวิธานชั้นนำบางส่วนโดยใช้อนุกรมวิธานเอกสาร
/*
* จำแนกข้อความด้วย Document Taxonomy โดยใช้ C#
*/
Classifier classifier = new Classifier();
string statement = "Sooner or later technology will overcome labor work";
var response = classifier.Classify(statement, 2, Taxonomy.Documents);
response.BestResults.ToList().ForEach(bestResult => Console.WriteLine($"Class: {bestResult.Name}, \tProbability: {bestResult.Probability}"));
Class: ADVE, Probability: 0.9999645
Class: Report, Probability: 3.461805E-05
รับใบอนุญาตฟรี
คุณสามารถ รับใบอนุญาตชั่วคราวได้ฟรี เพื่อใช้ API โดยไม่มีข้อจำกัดในการประเมิน
บทสรุป
โดยสรุป เราได้เรียนรู้การจัดประเภทเอกสารประเภทต่างๆ โดยใช้อนุกรมวิธานที่แตกต่างกัน ในตัวอย่าง เราจัดประเภทข้อความตาม IAB-2 และการจัดหมวดหมู่เอกสารโดยใช้ C# หลังจากอ่านบทความต่างๆ แล้ว คุณสามารถสร้างแอปพลิเคชันการจำแนกประเภท .NET ของคุณเองเพื่อ จัดประเภทเอกสาร รวมถึงข้อความที่มีอนุกรมวิธานและการกำหนดค่าต่างกัน
สำหรับข้อมูลเพิ่มเติมเกี่ยวกับ API โปรดไปที่ เอกสารประกอบ สำหรับข้อสงสัย ติดต่อเราผ่านทาง ฟอรัม