In precedenza, abbiamo discusso di come possiamo automatizzare l’analisi e classificare documenti completi a livello di codice. Spesso è necessario classificare solo una parte del documento o solo alcune affermazioni. In questo articolo identificheremo le migliori categorie tassonomiche possibili del testo selezionato. Impareremo come classificare il testo secondo IAB-2 e documentare le tassonomie usando C#.

Di seguito vengono trattati i seguenti argomenti:

API .NET per la classificazione tassonomica del testo

GroupDocs.Classification for .NET è l’API che consente diverse tecniche per la classificazione del contenuto di testo all’interno di applicazioni .NET. Utilizzeremo questa API per trovare le migliori categorie tassonomiche possibili del testo fornito usando C# negli esempi.

Puoi scaricare le DLL o il programma di installazione MSI dalla sezione download o installare l’API nella tua applicazione .NET tramite NuGet.

PM> Install-Package GroupDocs.Classification

Classificazione del testo con tassonomia IAB-2 utilizzando C#

IAB-2 classifica il contenuto in categorie tassonomiche definite e quindi lo classifica in base all’analisi. Di seguito sono riportati i passaggi per la classificazione tassonomica del testo con la tassonomia IAB-2 utilizzando C#.

  • Crea un’istanza del classificatore usando la classe Classifier.
  • Definire il testo per l’analisi tassonomica.
  • Imposta la Tassonomia come IAB2.
  • Imposta il numero di migliori risultati conteggiati come risultato della classificazione. (Opzionale)
  • Ottieni le categorie tassonomiche del testo fornito chiamando il metodo Classify con i parametri definiti.
  • Stampa il BestResults dalla risposta di classificazione del metodo Classify.

Il codice sorgente C# seguente mostra come classificare il testo usando la tassonomia IAB-2 e ottenere le categorie principali con la corrispondenza migliore.

/*
* Classifica il testo con la tassonomia IAB-2 usando C#
*/
Classifier classifier = new Classifier();
string statement = "Medicine is an important part of our lives";

var response = classifier.Classify(statement, 3, Taxonomy.Iab2);
response.BestResults.ToList().ForEach(bestResult => Console.WriteLine($"Class: {bestResult.Name}, \tProbability: {bestResult.Probability}"));
 Class: Healthy\_Living,      Probability: 0.4144087
 Class: Medical\_Health,     Probability: 0.2108202
 Class: Science,                 Probability: 0.1584931

Classificazione del testo con tassonomia dei documenti utilizzando C#

La tassonomia dei documenti classifica il contenuto in diverse classi di documenti, ad esempio annunci, fatture, notizie, curriculum, lettere, e-mail e così via. Di seguito sono riportati i passaggi per la classificazione tassonomica del testo con la tassonomia dei documenti utilizzando C#.

  • Istanziare il Classificatore.
  • Carica il testo per l’analisi tassonomica.
  • Definire il numero di migliori risultati conteggiati come risultato della classificazione. (Opzionale)
  • Imposta la Tassonomia come Documenti.
  • Ottieni i gruppi tassonomici chiamando il metodo Classify con i parametri sopra definiti.
  • Stampa il BestResults dalla risposta di classificazione del metodo Classify.

Il codice sorgente C# seguente mostra come classificare il contenuto di testo e ottenere alcune delle sue principali categorie tassonomiche usando tassonomia dei documenti.

/*
* Classifica il testo con la tassonomia dei documenti usando C#
*/
Classifier classifier = new Classifier();
string statement = "Sooner or later technology will overcome labor work";

var response = classifier.Classify(statement, 2, Taxonomy.Documents);
response.BestResults.ToList().ForEach(bestResult => Console.WriteLine($"Class: {bestResult.Name}, \tProbability: {bestResult.Probability}"));
 Class: ADVE,      Probability: 0.9999645
 Class: Report,     Probability: 3.461805E-05

Ottieni una licenza gratuita

Puoi ottenere una licenza temporanea gratuita per utilizzare l’API senza i limiti di valutazione.

Conclusione

Per riassumere, abbiamo imparato a classificare vari tipi di documenti utilizzando diverse tassonomie. Negli esempi, abbiamo classificato il testo secondo IAB-2 e le tassonomie dei documenti utilizzando C#. Dopo aver esaminato la serie di post, puoi creare la tua applicazione di classificazione .NET per classificare documenti e testo con diverse tassonomie e configurazioni.

Per ulteriori informazioni sull’API, visita la documentazione. Per domande, contattaci tramite il forum.

Guarda anche