Sebelumnya, kita telah membahas bagaimana kita dapat mengotomatiskan analisis dan mengklasifikasikan dokumen lengkap secara terprogram. Seringkali diperlukan untuk mengklasifikasikan hanya beberapa bagian dari dokumen atau hanya beberapa pernyataan. Pada artikel ini, kami akan mengidentifikasi kategori taksonomi terbaik dari teks yang dipilih. Kita akan belajar bagaimana kita dapat mengklasifikasikan teks menurut IAB-2 dan mendokumentasikan taksonomi menggunakan C#.

Topik-topik berikut dibahas di bawah ini:

.NET API untuk Klasifikasi Taksonomi Teks

GroupDocs.Classification for .NET adalah API yang memungkinkan berbagai teknik klasifikasi konten teks dalam aplikasi .NET. Kami akan menggunakan API ini untuk menemukan kategori taksonomi terbaik dari teks yang disediakan menggunakan C# sebagai contoh.

Anda dapat mengunduh penginstal DLL atau MSI dari bagian unduhan atau menginstal API di aplikasi .NET Anda melalui NuGet.

PM> Install-Package GroupDocs.Classification

Klasifikasi Teks dengan Taksonomi IAB-2 menggunakan C#

IAB-2 mengkategorikan konten ke dalam [kategori taksonomi] yang ditentukan 9 dan kemudian mengklasifikasikannya berdasarkan analisis. Berikut langkah-langkah klasifikasi taksonomi teks dengan taksonomi IAB-2 menggunakan C#.

  • Instansiasi classifier menggunakan Classifier class.
  • Tentukan teks untuk analisis taksonomi.
  • Tetapkan Taksonomi sebagai IAB2.
  • Tetapkan jumlah hitungan hasil terbaik sebagai hasil klasifikasi. (Opsional)
  • Dapatkan kategori taksonomi dari teks yang disediakan dengan memanggil metode Classify dengan parameter yang ditentukan.
  • Cetak Hasil Terbaik dari respons klasifikasi metode Klasifikasi.

Kode sumber C# berikut menunjukkan cara mengklasifikasikan teks menggunakan taksonomi IAB-2 dan mendapatkan kategori teratas dengan kecocokan terbaik.

/*
* Klasifikasikan Teks dengan Taksonomi IAB-2 menggunakan C#
*/
Classifier classifier = new Classifier();
string statement = "Medicine is an important part of our lives";

var response = classifier.Classify(statement, 3, Taxonomy.Iab2);
response.BestResults.ToList().ForEach(bestResult => Console.WriteLine($"Class: {bestResult.Name}, \tProbability: {bestResult.Probability}"));
 Class: Healthy\_Living,      Probability: 0.4144087
 Class: Medical\_Health,     Probability: 0.2108202
 Class: Science,                 Probability: 0.1584931

Klasifikasi Teks dengan Taksonomi Dokumen menggunakan C#

Taksonomi dokumen mengklasifikasikan konten ke dalam [kelas dokumen] yang berbeda 16, seperti iklan, faktur, berita, resume, surat, email, dll. Berikut adalah langkah-langkah klasifikasi taksonomi teks dengan taksonomi dokumen menggunakan C#.

  • Instansiasi Pengklasifikasi.
  • Muat teks untuk analisis taksonomi.
  • Tentukan jumlah hitungan hasil terbaik sebagai hasil klasifikasi. (Opsional)
  • Tetapkan Taksonomi sebagai Dokumen.
  • Dapatkan grup taksonomi dengan memanggil metode Classify dengan parameter yang ditentukan di atas.
  • Cetak Hasil Terbaik dari respons klasifikasi metode Klasifikasi.

Kode sumber C# berikut menunjukkan cara mengklasifikasikan konten teks dan mendapatkan beberapa kategori taksonomi teratasnya menggunakan taksonomi dokumen.

/*
* Klasifikasi Teks dengan Taksonomi Dokumen menggunakan C#
*/
Classifier classifier = new Classifier();
string statement = "Sooner or later technology will overcome labor work";

var response = classifier.Classify(statement, 2, Taxonomy.Documents);
response.BestResults.ToList().ForEach(bestResult => Console.WriteLine($"Class: {bestResult.Name}, \tProbability: {bestResult.Probability}"));
 Class: ADVE,      Probability: 0.9999645
 Class: Report,     Probability: 3.461805E-05

Dapatkan Lisensi Gratis

Anda bisa mendapatkan lisensi sementara gratis untuk menggunakan API tanpa batasan evaluasi.

Kesimpulan

Singkatnya, kami belajar mengklasifikasikan berbagai jenis dokumen menggunakan taksonomi yang berbeda. Dalam contoh, kami mengklasifikasikan teks sesuai IAB-2 dan taksonomi dokumen menggunakan C#. Setelah melalui serangkaian posting, Anda dapat membuat aplikasi klasifikasi .NET Anda sendiri untuk mengklasifikasikan dokumen serta teks dengan taksonomi dan konfigurasi yang berbeda.

Untuk informasi lebih lanjut tentang API, kunjungi dokumentasi. Untuk pertanyaan, hubungi kami melalui forum.

Lihat juga