Daha önce, nasıl [analizi otomatikleştirebileceğimizi ve eksiksiz belgeleri programatik olarak sınıflandırabileceğimizi] tartışmıştık]2. Genellikle belgenin sadece bir kısmını veya sadece birkaç ifadeyi sınıflandırmak gerekir. Bu yazıda, seçilen metnin mümkün olan en iyi taksonomik kategorilerini belirleyeceğiz. C# kullanarak metni IAB-2’ye göre nasıl sınıflandırabileceğimizi ve sınıflandırmaları belgeleyebileceğimizi öğreneceğiz.
Aşağıdaki konular aşağıda ele alınmıştır:
- Metnin Taksonomik Sınıflandırması için .NET API
- C# kullanarak IAB-2 Taksonomisi ile Metin Sınıflandırma
- C# kullanarak Belge Taksonomisi ile Metin Sınıflandırma
Metnin Taksonomik Sınıflandırması için .NET API
GroupDocs.Classification for .NET, .NET uygulamalarında metin içeriğinin sınıflandırılması için farklı tekniklere izin veren API’dir. Örneklerde C# kullanarak sağlanan metnin mümkün olan en iyi taksonomik kategorilerini bulmak için bu API’yi kullanacağız.
DLL’leri veya MSI yükleyicisini indirilenler bölümünden indirebilir veya NuGet aracılığıyla .NET uygulamanıza API’yi yükleyebilirsiniz.
PM> Install-Package GroupDocs.Classification
C# kullanarak IAB-2 Taksonomisi ile Metin Sınıflandırma
IAB-2, içeriği tanımlanmış taksonomik kategorilere göre sınıflandırır ve ardından analize göre sınıflandırır. Aşağıdakiler, C# kullanarak IAB-2 taksonomisi ile metnin taksonomik sınıflandırmasına yönelik adımlardır.
- Classifier sınıfını kullanarak sınıflandırıcının örneğini oluşturun.
- Taksonomik analiz için metni tanımlayın.
- Sınıflandırma öğesini IAB2 olarak ayarlayın.
- Sınıflandırmanın bir sonucu olarak sayılan en iyi sonuçların sayısını ayarlayın. (İsteğe bağlı)
- Tanımlanan parametrelerle Classify yöntemini çağırarak sağlanan metnin taksonomik kategorilerini alın.
- Classify yönteminin sınıflandırma yanıtından BestResults‘ü yazdırın.
Aşağıdaki C# kaynak kodu, IAB-2 taksonomisini kullanarak metnin nasıl sınıflandırılacağını ve en iyi eşleşme ile en iyi kategorilerin nasıl alınacağını gösterir.
/*
* C# kullanarak IAB-2 Taksonomisi ile Metni Sınıflandırın
*/
Classifier classifier = new Classifier();
string statement = "Medicine is an important part of our lives";
var response = classifier.Classify(statement, 3, Taxonomy.Iab2);
response.BestResults.ToList().ForEach(bestResult => Console.WriteLine($"Class: {bestResult.Name}, \tProbability: {bestResult.Probability}"));
Class: Healthy\_Living, Probability: 0.4144087
Class: Medical\_Health, Probability: 0.2108202
Class: Science, Probability: 0.1584931
C# kullanarak Belge Taksonomisi ile Metin Sınıflandırma
Belge sınıflandırması, içeriği reklamlar, faturalar, haberler, özgeçmiş, mektuplar, e-postalar vb.
- Sınıflandırıcıyı örnekleyin.
- Taksonomik analiz için metni yükleyin.
- Sınıflandırmanın bir sonucu olarak sayılan en iyi sonuçların sayısını tanımlayın. (İsteğe bağlı)
- Sınıflandırma öğesini Belgeler olarak ayarlayın.
- Yukarıda tanımlanan parametrelerle Classify metodunu çağırarak taksonomik grupları elde edin.
- Classify yönteminin sınıflandırma yanıtından BestResults‘yi yazdırın.
Aşağıdaki C# kaynak kodu, belge sınıflandırmasını kullanarak metin içeriğinin nasıl sınıflandırılacağını ve en önemli taksonomik kategorilerinden bazılarının nasıl alınacağını gösterir.
/*
* C# kullanarak Metni Belge Taksonomisi ile Sınıflandırın
*/
Classifier classifier = new Classifier();
string statement = "Sooner or later technology will overcome labor work";
var response = classifier.Classify(statement, 2, Taxonomy.Documents);
response.BestResults.ToList().ForEach(bestResult => Console.WriteLine($"Class: {bestResult.Name}, \tProbability: {bestResult.Probability}"));
Class: ADVE, Probability: 0.9999645
Class: Report, Probability: 3.461805E-05
Ücretsiz Lisans Alın
API’yi değerlendirme sınırlamaları olmadan kullanmak için ücretsiz bir geçici lisans alabilirsiniz.
Çözüm
Özetlemek gerekirse, farklı türde belgeleri farklı taksonomiler kullanarak sınıflandırmayı öğrendik. Örneklerde, metni IAB-2’ye ve C# kullanarak belge taksonomilerine göre sınıflandırdık. Bir dizi gönderiyi inceledikten sonra, belgeleri sınıflandırmak için kendi .NET sınıflandırma uygulamanızı ve ayrıca farklı taksonomiler ve yapılandırmalara sahip metinler oluşturabilirsiniz.
API hakkında daha fazla bilgi için belgeleri ziyaret edin. Sorularınız için forum aracılığıyla bize ulaşın.