Zuvor haben wir besprochen, wie wir die Analyse automatisieren und vollständige Dokumente programmgesteuert klassifizieren können. Oft ist es erforderlich, nur einen Teil des Dokuments oder nur wenige Aussagen zu klassifizieren. In diesem Artikel identifizieren wir die bestmöglichen taxonomischen Kategorien des ausgewählten Textes. Wir werden lernen, wie wir Text nach IAB-2 klassifizieren und Taxonomien mit C# dokumentieren können.

Nachfolgend werden folgende Themen behandelt:

.NET-API für die taxonomische Klassifizierung von Text

GroupDocs.Classification for .NET ist die API, die verschiedene Techniken zur Klassifizierung von Textinhalten in .NET-Anwendungen ermöglicht. Wir werden diese API verwenden, um die bestmöglichen taxonomischen Kategorien des bereitgestellten Textes mithilfe von C# in Beispielen zu finden.

Sie können das DLLs- oder MSI-Installationsprogramm aus dem Downloadbereich herunterladen oder die API in Ihrer .NET-Anwendung über NuGet installieren.

PM> Install-Package GroupDocs.Classification

Textklassifizierung mit IAB-2-Taxonomie mit C#

IAB-2 kategorisiert die Inhalte in definierte taxonomische Kategorien und klassifiziert sie dann basierend auf der Analyse. Im Folgenden sind die Schritte zur taxonomischen Klassifizierung von Text mit IAB-2-Taxonomie unter Verwendung von C# aufgeführt.

  • Instanziieren Sie den Klassifikator mit der Klasse Classifier.
  • Definieren Sie den Text für die taxonomische Analyse.
  • Legen Sie die Taxonomie als IAB2 fest.
  • Legen Sie die Anzahl der besten Ergebnisse als Ergebnis der Klassifizierung fest. (Optional)
  • Rufen Sie die taxonomischen Kategorien des bereitgestellten Textes ab, indem Sie die Methode Classify mit den definierten Parametern aufrufen.
  • Drucken Sie die BestResults aus der Klassifizierungsantwort der Classify-Methode.

Der folgende C#-Quellcode zeigt, wie Text mithilfe der IAB-2-Taxonomie klassifiziert und die Top-Kategorien mit der besten Übereinstimmung abgerufen werden.

/*
* Text mit IAB-2-Taxonomie mit C# klassifizieren
*/
Classifier classifier = new Classifier();
string statement = "Medicine is an important part of our lives";

var response = classifier.Classify(statement, 3, Taxonomy.Iab2);
response.BestResults.ToList().ForEach(bestResult => Console.WriteLine($"Class: {bestResult.Name}, \tProbability: {bestResult.Probability}"));
 Class: Healthy\_Living,      Probability: 0.4144087
 Class: Medical\_Health,     Probability: 0.2108202
 Class: Science,                 Probability: 0.1584931

Textklassifizierung mit Dokumententaxonomie mit C#

Die Dokumententaxonomie klassifiziert den Inhalt in verschiedene Dokumentenklassen, z. B. Anzeigen, Rechnungen, Nachrichten, Lebensläufe, Briefe, E-Mails usw. Im Folgenden sind die Schritte zur taxonomischen Klassifizierung von Text mit der Dokumententaxonomie unter Verwendung von C# aufgeführt.

  • Instanziiere den Classifier.
  • Laden Sie den Text für die taxonomische Analyse.
  • Definieren Sie die Anzahl der besten Ergebnisse, die als Ergebnis der Klassifizierung gezählt werden. (Optional)
  • Legen Sie die Taxonomie als Dokumente fest.
  • Rufen Sie die taxonomischen Gruppen ab, indem Sie die Methode Classify mit den oben definierten Parametern aufrufen.
  • Drucken Sie die BestResults aus der Klassifizierungsantwort der Classify-Methode.

Der folgende C#-Quellcode zeigt, wie Sie Textinhalte klassifizieren und einige der wichtigsten taxonomischen Kategorien mithilfe von Dokumenttaxonomie abrufen.

/*
* Text mit Dokumententaxonomie mit C# klassifizieren
*/
Classifier classifier = new Classifier();
string statement = "Sooner or later technology will overcome labor work";

var response = classifier.Classify(statement, 2, Taxonomy.Documents);
response.BestResults.ToList().ForEach(bestResult => Console.WriteLine($"Class: {bestResult.Name}, \tProbability: {bestResult.Probability}"));
 Class: ADVE,      Probability: 0.9999645
 Class: Report,     Probability: 3.461805E-05

Holen Sie sich eine kostenlose Lizenz

Sie können eine kostenlose temporäre Lizenz erhalten, um die API ohne die Evaluierungseinschränkungen zu verwenden.

Fazit

Zusammenfassend haben wir gelernt, verschiedene Arten von Dokumenten anhand verschiedener Taxonomien zu klassifizieren. In den Beispielen haben wir den Text nach IAB-2 und die Dokumententaxonomien mit C# klassifiziert. Nachdem Sie die Beitragsreihe durchgegangen sind, können Sie Ihre eigene .NET-Klassifizierungsanwendung erstellen, um Dokumente sowie Text mit unterschiedlichen Taxonomien und Konfigurationen zu klassifizieren.

Weitere Informationen zur API finden Sie in der Dokumentation. Bei Fragen kontaktieren Sie uns über das Forum.

Siehe auch