In precedenza, abbiamo discusso di come possiamo automatizzare l’analisi e classificare documenti completi a livello di codice. Spesso è necessario classificare solo una parte del documento o solo alcune affermazioni. In questo articolo identificheremo le migliori categorie tassonomiche possibili del testo selezionato. Impareremo come classificare il testo secondo IAB-2 e documentare le tassonomie usando C#.
Di seguito vengono trattati i seguenti argomenti:
- API .NET per la classificazione tassonomica del testo
- Classificazione del testo con tassonomia IAB-2 utilizzando C#
- Classificazione del testo con tassonomia dei documenti utilizzando C#
API .NET per la classificazione tassonomica del testo
GroupDocs.Classification for .NET è l’API che consente diverse tecniche per la classificazione del contenuto di testo all’interno di applicazioni .NET. Utilizzeremo questa API per trovare le migliori categorie tassonomiche possibili del testo fornito usando C# negli esempi.
Puoi scaricare le DLL o il programma di installazione MSI dalla sezione download o installare l’API nella tua applicazione .NET tramite NuGet.
PM> Install-Package GroupDocs.Classification
Classificazione del testo con tassonomia IAB-2 utilizzando C#
IAB-2 classifica il contenuto in categorie tassonomiche definite e quindi lo classifica in base all’analisi. Di seguito sono riportati i passaggi per la classificazione tassonomica del testo con la tassonomia IAB-2 utilizzando C#.
- Crea un’istanza del classificatore usando la classe Classifier.
- Definire il testo per l’analisi tassonomica.
- Imposta la Tassonomia come IAB2.
- Imposta il numero di migliori risultati conteggiati come risultato della classificazione. (Opzionale)
- Ottieni le categorie tassonomiche del testo fornito chiamando il metodo Classify con i parametri definiti.
- Stampa il BestResults dalla risposta di classificazione del metodo Classify.
Il codice sorgente C# seguente mostra come classificare il testo usando la tassonomia IAB-2 e ottenere le categorie principali con la corrispondenza migliore.
/*
* Classifica il testo con la tassonomia IAB-2 usando C#
*/
Classifier classifier = new Classifier();
string statement = "Medicine is an important part of our lives";
var response = classifier.Classify(statement, 3, Taxonomy.Iab2);
response.BestResults.ToList().ForEach(bestResult => Console.WriteLine($"Class: {bestResult.Name}, \tProbability: {bestResult.Probability}"));
Class: Healthy\_Living, Probability: 0.4144087
Class: Medical\_Health, Probability: 0.2108202
Class: Science, Probability: 0.1584931
Classificazione del testo con tassonomia dei documenti utilizzando C#
La tassonomia dei documenti classifica il contenuto in diverse classi di documenti, ad esempio annunci, fatture, notizie, curriculum, lettere, e-mail e così via. Di seguito sono riportati i passaggi per la classificazione tassonomica del testo con la tassonomia dei documenti utilizzando C#.
- Istanziare il Classificatore.
- Carica il testo per l’analisi tassonomica.
- Definire il numero di migliori risultati conteggiati come risultato della classificazione. (Opzionale)
- Imposta la Tassonomia come Documenti.
- Ottieni i gruppi tassonomici chiamando il metodo Classify con i parametri sopra definiti.
- Stampa il BestResults dalla risposta di classificazione del metodo Classify.
Il codice sorgente C# seguente mostra come classificare il contenuto di testo e ottenere alcune delle sue principali categorie tassonomiche usando tassonomia dei documenti.
/*
* Classifica il testo con la tassonomia dei documenti usando C#
*/
Classifier classifier = new Classifier();
string statement = "Sooner or later technology will overcome labor work";
var response = classifier.Classify(statement, 2, Taxonomy.Documents);
response.BestResults.ToList().ForEach(bestResult => Console.WriteLine($"Class: {bestResult.Name}, \tProbability: {bestResult.Probability}"));
Class: ADVE, Probability: 0.9999645
Class: Report, Probability: 3.461805E-05
Ottieni una licenza gratuita
Puoi ottenere una licenza temporanea gratuita per utilizzare l’API senza i limiti di valutazione.
Conclusione
Per riassumere, abbiamo imparato a classificare vari tipi di documenti utilizzando diverse tassonomie. Negli esempi, abbiamo classificato il testo secondo IAB-2 e le tassonomie dei documenti utilizzando C#. Dopo aver esaminato la serie di post, puoi creare la tua applicazione di classificazione .NET per classificare documenti e testo con diverse tassonomie e configurazioni.
Per ulteriori informazioni sull’API, visita la documentazione. Per domande, contattaci tramite il forum.