En este artículo, aprenderemos cómo leer y analizar documentos PDF y luego extraer mediante programación valores de campo de formulario PDF en C#. Anteriormente, hemos visto cómo extraer valores de formularios PDF en Java. Después de leer estos artículos, si completó formularios de comentarios, puede extraer los valores dentro de sus aplicaciones .NET y Java para analizarlos o guardarlos en la base de datos.

Analizar formularios PDF para extraer valores en C#

API .NET para analizar y extraer valores de formularios PDF

GroupDocs.Parser para .NET es una API potente y fácil de usar de análisis y extracción de datos para las aplicaciones .NET. Admite la extracción de texto, metadatos e imágenes de documentos de procesamiento de texto y PDF, hojas de cálculo, presentaciones, correos electrónicos, marcas, libros electrónicos, archivos y mucho más. Una de las características importantes y que también se mostrará a continuación es el análisis de formularios PDF rellenables para extraer los valores de los campos de formulario utilizando una pequeña pieza de código C#.

Para probar los ejemplos mencionados a continuación y otros de la API, puede descargar e instalar la API desde NuGet o directamente descargar desde las descargas de GroupDocs.

PM> Install-Package GroupDocs.Parser

Extraiga datos del campo de formulario PDF usando C#

Los siguientes pasos simples indican cómo analizar PDF y luego extraer valores de campo de formulario PDF en C#.

  • Cargue el archivo PDF usando la clase Parser.
  • Analice el formulario PDF usando el método ParseForm.
  • Atraviesa la colección analizada para extraer los valores de los campos de formulario.

El siguiente ejemplo de código C# muestra la extracción de valores de campo de formularios PDF completos dentro de aplicaciones .NET.

// Analice el formulario PDF completo para extraer valores de campo en C#
using (Parser parser = new Parser("filePath/PDFForm.pdf"))
{
    // Extraer datos del formulario PDF
    DocumentData data = parser.ParseForm();
    // Iterar sobre los datos de campos de formulario PDF extraídos
    for (int i = 0; i < data.Count; i++)
    {
        Console.Write(data[i].Name + ": ");
        PageTextArea area = data[i].PageArea as PageTextArea;
        Console.WriteLine(area == null ? "Not a template field" : area.Text);
    }
}
COMPANY: GroupDocs
EMAIL: everything@groupdocs.com
COUNTRY: Australia

Conclusión

Confío en que ahora se sentirá cómodo desarrollando su propia aplicación basada en .NET que puede analizar archivos PDF y obtener valores de campos de formulario PDF rellenables de forma rápida y precisa. Para agregar más funciones, puede obtener más información sobre la API en los artículos de documentación y los ejemplos de C# en GitHub.

Para consultas y respuestas rápidas, póngase en contacto en el foro.

Ver también