Daha önce, nasıl [analizi otomatikleştirebileceğimizi ve eksiksiz belgeleri programatik olarak sınıflandırabileceğimizi] tartışmıştık]2. Genellikle belgenin sadece bir kısmını veya sadece birkaç ifadeyi sınıflandırmak gerekir. Bu yazıda, seçilen metnin mümkün olan en iyi taksonomik kategorilerini belirleyeceğiz. C# kullanarak metni IAB-2’ye göre nasıl sınıflandırabileceğimizi ve sınıflandırmaları belgeleyebileceğimizi öğreneceğiz.

Aşağıdaki konular aşağıda ele alınmıştır:

Metnin Taksonomik Sınıflandırması için .NET API

GroupDocs.Classification for .NET, .NET uygulamalarında metin içeriğinin sınıflandırılması için farklı tekniklere izin veren API’dir. Örneklerde C# kullanarak sağlanan metnin mümkün olan en iyi taksonomik kategorilerini bulmak için bu API’yi kullanacağız.

DLL’leri veya MSI yükleyicisini indirilenler bölümünden indirebilir veya NuGet aracılığıyla .NET uygulamanıza API’yi yükleyebilirsiniz.

PM> Install-Package GroupDocs.Classification

C# kullanarak IAB-2 Taksonomisi ile Metin Sınıflandırma

IAB-2, içeriği tanımlanmış taksonomik kategorilere göre sınıflandırır ve ardından analize göre sınıflandırır. Aşağıdakiler, C# kullanarak IAB-2 taksonomisi ile metnin taksonomik sınıflandırmasına yönelik adımlardır.

  • Classifier sınıfını kullanarak sınıflandırıcının örneğini oluşturun.
  • Taksonomik analiz için metni tanımlayın.
  • Sınıflandırma öğesini IAB2 olarak ayarlayın.
  • Sınıflandırmanın bir sonucu olarak sayılan en iyi sonuçların sayısını ayarlayın. (İsteğe bağlı)
  • Tanımlanan parametrelerle Classify yöntemini çağırarak sağlanan metnin taksonomik kategorilerini alın.
  • Classify yönteminin sınıflandırma yanıtından BestResults‘ü yazdırın.

Aşağıdaki C# kaynak kodu, IAB-2 taksonomisini kullanarak metnin nasıl sınıflandırılacağını ve en iyi eşleşme ile en iyi kategorilerin nasıl alınacağını gösterir.

/*
* C# kullanarak IAB-2 Taksonomisi ile Metni Sınıflandırın
*/
Classifier classifier = new Classifier();
string statement = "Medicine is an important part of our lives";

var response = classifier.Classify(statement, 3, Taxonomy.Iab2);
response.BestResults.ToList().ForEach(bestResult => Console.WriteLine($"Class: {bestResult.Name}, \tProbability: {bestResult.Probability}"));
 Class: Healthy\_Living,      Probability: 0.4144087
 Class: Medical\_Health,     Probability: 0.2108202
 Class: Science,                 Probability: 0.1584931

C# kullanarak Belge Taksonomisi ile Metin Sınıflandırma

Belge sınıflandırması, içeriği reklamlar, faturalar, haberler, özgeçmiş, mektuplar, e-postalar vb.

Aşağıdaki C# kaynak kodu, belge sınıflandırmasını kullanarak metin içeriğinin nasıl sınıflandırılacağını ve en önemli taksonomik kategorilerinden bazılarının nasıl alınacağını gösterir.

/*
* C# kullanarak Metni Belge Taksonomisi ile Sınıflandırın
*/
Classifier classifier = new Classifier();
string statement = "Sooner or later technology will overcome labor work";

var response = classifier.Classify(statement, 2, Taxonomy.Documents);
response.BestResults.ToList().ForEach(bestResult => Console.WriteLine($"Class: {bestResult.Name}, \tProbability: {bestResult.Probability}"));
 Class: ADVE,      Probability: 0.9999645
 Class: Report,     Probability: 3.461805E-05

Ücretsiz Lisans Alın

API’yi değerlendirme sınırlamaları olmadan kullanmak için ücretsiz bir geçici lisans alabilirsiniz.

Çözüm

Özetlemek gerekirse, farklı türde belgeleri farklı taksonomiler kullanarak sınıflandırmayı öğrendik. Örneklerde, metni IAB-2’ye ve C# kullanarak belge taksonomilerine göre sınıflandırdık. Bir dizi gönderiyi inceledikten sonra, belgeleri sınıflandırmak için kendi .NET sınıflandırma uygulamanızı ve ayrıca farklı taksonomiler ve yapılandırmalara sahip metinler oluşturabilirsiniz.

API hakkında daha fazla bilgi için belgeleri ziyaret edin. Sorularınız için forum aracılığıyla bize ulaşın.

Ayrıca bakınız