En este artículo, aprenderemos cómo leer y analizar documentos PDF y luego extraer mediante programación valores de campo de formulario PDF en C#. Anteriormente, hemos visto cómo extraer valores de formularios PDF en Java. Después de leer estos artículos, si completó formularios de comentarios, puede extraer los valores dentro de sus aplicaciones .NET y Java para analizarlos o guardarlos en la base de datos.
API .NET para analizar y extraer valores de formularios PDF
GroupDocs.Parser for .NET es una API potente y fácil de usar de análisis y extracción de datos para las aplicaciones .NET. Admite la extracción de texto, metadatos e imágenes de documentos de procesamiento de texto y PDF, hojas de cálculo, presentaciones, correos electrónicos, marcas, libros electrónicos, archivos y mucho más. Una de las características importantes y que también se mostrará a continuación es el análisis de formularios PDF rellenables para extraer los valores de los campos de formulario utilizando una pequeña pieza de código C#.
Para probar los ejemplos mencionados a continuación y otros de la API, puede descargar e instalar la API desde NuGet o directamente descargar desde las descargas de GroupDocs.
PM> Install-Package GroupDocs.Parser
Extraiga datos del campo de formulario PDF usando C#
Los siguientes pasos simples indican cómo analizar PDF y luego extraer valores de campo de formulario PDF en C#.
- Cargue el archivo PDF usando la clase Parser.
- Analice el formulario PDF usando el método ParseForm.
- Atraviesa la colección analizada para extraer los valores de los campos de formulario.
El siguiente ejemplo de código C# muestra la extracción de valores de campo de formularios PDF completos dentro de aplicaciones .NET.
// Analice el formulario PDF completo para extraer valores de campo en C#
using (Parser parser = new Parser("filePath/PDFForm.pdf"))
{
// Extraer datos del formulario PDF
DocumentData data = parser.ParseForm();
// Iterar sobre los datos de campos de formulario PDF extraídos
for (int i = 0; i < data.Count; i++)
{
Console.Write(data[i].Name + ": ");
PageTextArea area = data[i].PageArea as PageTextArea;
Console.WriteLine(area == null ? "Not a template field" : area.Text);
}
}
COMPANY: GroupDocs
EMAIL: everything@groupdocs.com
COUNTRY: Australia
Conclusión
Confío en que ahora se sentirá cómodo desarrollando su propia aplicación basada en .NET que puede analizar archivos PDF y obtener valores de campos de formulario PDF rellenables de forma rápida y precisa. Para agregar más funciones, puede obtener más información sobre la API en los artículos de documentación y los ejemplos de C# en GitHub.
Para consultas y respuestas rápidas, póngase en contacto en el foro.