Anteriormente, discutimos cómo podemos automatizar el análisis y clasificar documentos completos mediante programación. A menudo se requiere clasificar solo una parte del documento o solo algunas declaraciones. En este artículo, identificaremos las mejores categorías taxonómicas posibles del texto seleccionado. Aprenderemos cómo podemos clasificar texto según IAB-2 y documentar taxonomías usando C#.

Los siguientes temas se tratan a continuación:

.NET API para clasificación taxonómica de texto

GroupDocs.Classification for .NET es la API que permite diferentes técnicas para la clasificación de contenido de texto dentro de aplicaciones .NET. Usaremos esta API para encontrar las mejores categorías taxonómicas posibles del texto provisto usando C# en ejemplos.

Puede descargar el instalador DLL o MSI desde la sección de descargas o instalar la API en su aplicación .NET a través de NuGet.

PM> Install-Package GroupDocs.Classification

Clasificación de texto con taxonomía IAB-2 usando C#

IAB-2 categoriza el contenido en categorías taxonómicas definidas y luego lo clasifica según el análisis. Los siguientes son los pasos para la clasificación taxonómica de texto con taxonomía IAB-2 usando C#.

  • Crear una instancia del clasificador usando la clase Clasificador.
  • Definir el texto para el análisis taxonómico.
  • Configure la Taxonomía como IAB2.
  • Establecer el número de mejores resultados contados como resultado de la clasificación. (Opcional)
  • Obtenga las categorías taxonómicas del texto proporcionado llamando al método Classify con los parámetros definidos.
  • Imprime los BestResults de la respuesta de clasificación del método Classify.

El siguiente código fuente de C# muestra cómo clasificar el texto usando la taxonomía IAB-2 y obtener las categorías principales con la mejor coincidencia.

/*
* Clasificar texto con taxonomía IAB-2 usando C#
*/
Classifier classifier = new Classifier();
string statement = "Medicine is an important part of our lives";

var response = classifier.Classify(statement, 3, Taxonomy.Iab2);
response.BestResults.ToList().ForEach(bestResult => Console.WriteLine($"Class: {bestResult.Name}, \tProbability: {bestResult.Probability}"));
 Class: Healthy\_Living,      Probability: 0.4144087
 Class: Medical\_Health,     Probability: 0.2108202
 Class: Science,                 Probability: 0.1584931

Clasificación de texto con taxonomía de documentos usando C#

La taxonomía de documentos clasifica el contenido en diferentes clases de documentos, como anuncios, facturas, noticias, currículos, cartas, correos electrónicos, etc. Los siguientes son los pasos para la clasificación taxonómica de texto con taxonomía de documentos usando C#.

  • Crear una instancia del Clasificador.
  • Cargar el texto para el análisis taxonómico.
  • Definir el número de mejores resultados contados como resultado de la clasificación. (Opcional)
  • Configure la Taxonomía como Documentos.
  • Obtenga los grupos taxonómicos llamando al método Classify con los parámetros definidos anteriormente.
  • Imprime los BestResults de la respuesta de clasificación del método Classify.

El siguiente código fuente de C# muestra cómo clasificar el contenido de texto y obtener algunas de sus principales categorías taxonómicas mediante taxonomía de documentos.

/*
* Clasificar texto con taxonomía de documentos usando C#
*/
Classifier classifier = new Classifier();
string statement = "Sooner or later technology will overcome labor work";

var response = classifier.Classify(statement, 2, Taxonomy.Documents);
response.BestResults.ToList().ForEach(bestResult => Console.WriteLine($"Class: {bestResult.Name}, \tProbability: {bestResult.Probability}"));
 Class: ADVE,      Probability: 0.9999645
 Class: Report,     Probability: 3.461805E-05

Obtenga una licencia gratis

Puede obtener una licencia temporal gratuita para utilizar la API sin las limitaciones de evaluación.

Conclusión

En resumen, aprendimos a clasificar varios tipos de documentos utilizando diferentes taxonomías. En los ejemplos, clasificamos el texto según IAB-2 y las taxonomías de documentos usando C#. Después de leer la serie de publicaciones, puede crear su propia aplicación de clasificación .NET para clasificar documentos, así como texto con diferentes taxonomías y configuraciones.

Para obtener más información sobre la API, visite la documentación. Para consultas, contáctenos a través del foro.

Ver también