Neste artigo, aprenderemos como ler e analisar documentos PDF e, em seguida, extrair programaticamente valores de campo de formulário PDF em C#. Anteriormente, vimos como extrair valores de formulários PDF em Java. Depois de ler esses artigos, se você tiver preenchido os formulários de feedback, poderá extrair os valores em seus aplicativos .NET e Java para análise ou salvá-los no banco de dados.

Analisar formulários PDF para extrair valores em C#

API .NET para analisar e extrair valores de formulários PDF

GroupDocs.Parser for .NET é uma API de análise e extração de dados fácil de usar e poderosa para os aplicativos .NET. Ele suporta extração de texto, metadados e imagens de documentos de processamento de texto e PDF, planilhas, apresentações, e-mails, marcações, e-books, arquivos e muito mais. Um dos recursos significativos e também será mostrado abaixo é a análise de formulários PDF preenchíveis para extrair os valores do campo do formulário usando um pequeno pedaço de código C#.

Para testar os exemplos abaixo mencionados e outros da API, você pode baixar e instalar a API de NuGet ou diretamente download de downloads do GroupDocs.

PM> Install-Package GroupDocs.Parser

Extrair dados do campo de formulário PDF usando C

As etapas simples a seguir informam como analisar PDF e extrair valores de campo de formulário PDF em C#.

  • Carregue o arquivo PDF usando a classe Parser.
  • Analise o formulário PDF usando o método ParseForm.
  • Percorra a coleção analisada para extrair os valores do campo do formulário.

O exemplo de código C# a seguir mostra a extração de valores de campo de formulários PDF preenchidos em aplicativos .NET.

// Analise o formulário PDF preenchido para extrair valores de campo em C#
using (Parser parser = new Parser("filePath/PDFForm.pdf"))
{
    // Extrair dados do formulário PDF
    DocumentData data = parser.ParseForm();
    // Iterar sobre os dados de campos de formulário PDF extraídos
    for (int i = 0; i < data.Count; i++)
    {
        Console.Write(data[i].Name + ": ");
        PageTextArea area = data[i].PageArea as PageTextArea;
        Console.WriteLine(area == null ? "Not a template field" : area.Text);
    }
}
COMPANY: GroupDocs
EMAIL: everything@groupdocs.com
COUNTRY: Australia

Conclusão

Estou confiante de que agora você se sentirá confortável em desenvolver seu próprio aplicativo baseado em .NET que pode analisar arquivos PDF e buscar valores de campos de formulários PDF preenchíveis com rapidez e precisão. Para adicionar mais recursos, você pode aprender mais sobre a API nos artigos da documentação e exemplos de C# no GitHub.

Para dúvidas e respostas rápidas, entre em contato no fórum.

Veja também