In questo articolo impareremo come leggere e analizzare i documenti PDF e quindi estrarre a livello di codice i valori dei campi dei moduli PDF in C#. In precedenza, abbiamo visto come estrarre valori dai moduli PDF in Java. Dopo aver letto questi articoli, se hai compilato i moduli di feedback, puoi estrarre i valori all’interno delle tue applicazioni .NET e Java per l’analisi o salvarli nel database.

Analizza i moduli PDF per estrarre i valori in C#

API .NET per analizzare ed estrarre valori da moduli PDF

GroupDocs.Parser for .NET è un’API di analisi ed estrazione dati potente e facile da usare per le applicazioni .NET. Supporta l’estrazione di testo, metadati e immagini da documenti di elaborazione testi e PDF, fogli di calcolo, presentazioni, e-mail, markup, ebook, archivi e molto altro. Una delle funzionalità significative e verrà anche mostrata di seguito è l’analisi dei moduli PDF compilabili per estrarre i valori dei campi del modulo utilizzando un piccolo pezzo di codice C#.

Per testare gli esempi riportati di seguito e altri dell’API, puoi scaricare e installare l’API da NuGet o direttamente download dai download di GroupDocs.

PM> Install-Package GroupDocs.Parser

Estrai i dati dal campo del modulo PDF usando C#

I seguenti semplici passaggi spiegano come analizzare il PDF e quindi estrarre i valori dei campi del modulo PDF in C#.

  • Carica il file PDF utilizzando la classe Parser.
  • Analizza il modulo PDF utilizzando il metodo ParseForm.
  • Attraversa la raccolta analizzata per estrarre i valori del campo del modulo.

L’esempio di codice C# seguente mostra l’estrazione dei valori di campo dei moduli PDF compilati all’interno delle applicazioni .NET.

// Analizza il modulo PDF compilato per estrarre i valori dei campi in C#
using (Parser parser = new Parser("filePath/PDFForm.pdf"))
{
    // Estrai i dati dal modulo PDF
    DocumentData data = parser.ParseForm();
    // Esegui l'iterazione sui dati dei campi del modulo PDF estratti
    for (int i = 0; i < data.Count; i++)
    {
        Console.Write(data[i].Name + ": ");
        PageTextArea area = data[i].PageArea as PageTextArea;
        Console.WriteLine(area == null ? "Not a template field" : area.Text);
    }
}
COMPANY: GroupDocs
EMAIL: everything@groupdocs.com
COUNTRY: Australia

Conclusione

Sono fiducioso che ora ti sentirai a tuo agio nello sviluppare la tua applicazione basata su .NET in grado di analizzare i file PDF e recuperare i valori dai campi dei moduli PDF compilabili in modo rapido e preciso. Per aggiungere altre funzionalità, puoi saperne di più sull’API negli articoli documentazione e negli esempi C# su GitHub.

Per domande e risposte rapide, tieniti in contatto sul forum.

Guarda anche