Plus tôt, nous avons discuté de la façon dont nous pouvons automatiser l’analyse et classer des documents complets par programmation. Il est souvent nécessaire de ne classer qu’une partie du document ou seulement quelques déclarations. Dans cet article, nous identifierons les meilleures catégories taxonomiques possibles du texte sélectionné. Nous apprendrons comment nous pouvons classer le texte selon IAB-2 et documenter les taxonomies à l’aide de C#.

Les sujets suivants sont traités ci-dessous :

API .NET pour la classification taxonomique du texte

GroupDocs.Classification for .NET est l’API qui permet différentes techniques de classification du contenu textuel dans les applications .NET. Nous utiliserons cette API pour trouver les meilleures catégories taxonomiques possibles du texte fourni en utilisant C# dans les exemples.

Vous pouvez télécharger le programme d’installation DLLs ou MSI à partir de la section téléchargements ou installer l’API dans votre application .NET via NuGet.

PM> Install-Package GroupDocs.Classification

Classification de texte avec la taxonomie IAB-2 à l’aide de C#

IAB-2 catégorise le contenu en catégories taxonomiques définies, puis le classe en fonction de l’analyse. Voici les étapes de la classification taxonomique du texte avec taxonomie IAB-2 en utilisant C#.

  • Instanciez le classificateur à l’aide de la classe Classifier.
  • Définir le texte pour l’analyse taxonomique.
  • Définissez la Taxonomy comme IAB2.
  • Définissez le nombre de meilleurs résultats à la suite de la classification. (Optionnel)
  • Obtenez les catégories taxonomiques du texte fourni en appelant la méthode Classify avec les paramètres définis.
  • Imprimez les BestResults à partir de la réponse de classification de la méthode Classify.

Le code source C# suivant montre comment classer du texte à l’aide de la taxonomie IAB-2 et obtenir les meilleures catégories avec la meilleure correspondance.

/*
* Classifier du texte avec la taxonomie IAB-2 à l'aide de C#
*/
Classifier classifier = new Classifier();
string statement = "Medicine is an important part of our lives";

var response = classifier.Classify(statement, 3, Taxonomy.Iab2);
response.BestResults.ToList().ForEach(bestResult => Console.WriteLine($"Class: {bestResult.Name}, \tProbability: {bestResult.Probability}"));
 Class: Healthy\_Living,      Probability: 0.4144087
 Class: Medical\_Health,     Probability: 0.2108202
 Class: Science,                 Probability: 0.1584931

Classification de texte avec taxonomie de document à l’aide de C

La taxonomie des documents classe le contenu en différentes classes de documents, telles que les publicités, les factures, les actualités, les CV, les lettres, les e-mails, etc. Voici les étapes de la classification taxonomique du texte avec la taxonomie des documents à l’aide de C#.

  • Instancier le Classificateur.
  • Charger le texte pour l’analyse taxonomique.
  • Définir le nombre de meilleurs résultats compte à la suite de la classification. (Optionnel)
  • Définissez la Taxonomie comme Documents.
  • Obtenez les groupes taxonomiques en appelant la méthode Classify avec les paramètres définis ci-dessus.
  • Imprimez les BestResults à partir de la réponse de classification de la méthode Classify.

Le code source C# suivant montre comment classer le contenu textuel et obtenir certaines de ses principales catégories taxonomiques à l’aide de la taxonomie de document.

/*
* Classer le texte avec la taxonomie de document à l'aide de C #
*/
Classifier classifier = new Classifier();
string statement = "Sooner or later technology will overcome labor work";

var response = classifier.Classify(statement, 2, Taxonomy.Documents);
response.BestResults.ToList().ForEach(bestResult => Console.WriteLine($"Class: {bestResult.Name}, \tProbability: {bestResult.Probability}"));
 Class: ADVE,      Probability: 0.9999645
 Class: Report,     Probability: 3.461805E-05

Obtenez une licence gratuite

Vous pouvez obtenir une licence temporaire gratuite afin d’utiliser l’API sans les limitations d’évaluation.

Conclusion

En résumé, nous avons appris à classer différents types de documents en utilisant différentes taxonomies. Dans les exemples, nous avons classé le texte selon IAB-2 et les taxonomies de documents à l’aide de C#. Après avoir parcouru la série d’articles, vous pouvez créer votre propre application de classification .NET pour classifier des documents ainsi que du texte avec différentes taxonomies et configurations.

Pour en savoir plus sur l’API, consultez la documentation. Pour toute question, contactez-nous via le forum.

Voir également