In questo articolo impareremo come leggere e analizzare i documenti PDF e quindi estrarre a livello di codice i valori dei campi dei moduli PDF in C#. In precedenza, abbiamo visto come estrarre valori dai moduli PDF in Java. Dopo aver letto questi articoli, se hai compilato i moduli di feedback, puoi estrarre i valori all’interno delle tue applicazioni .NET e Java per l’analisi o salvarli nel database.
API .NET per analizzare ed estrarre valori da moduli PDF
GroupDocs.Parser for .NET è un’API di analisi ed estrazione dati potente e facile da usare per le applicazioni .NET. Supporta l’estrazione di testo, metadati e immagini da documenti di elaborazione testi e PDF, fogli di calcolo, presentazioni, e-mail, markup, ebook, archivi e molto altro. Una delle funzionalità significative e verrà anche mostrata di seguito è l’analisi dei moduli PDF compilabili per estrarre i valori dei campi del modulo utilizzando un piccolo pezzo di codice C#.
Per testare gli esempi riportati di seguito e altri dell’API, puoi scaricare e installare l’API da NuGet o direttamente download dai download di GroupDocs.
PM> Install-Package GroupDocs.Parser
Estrai i dati dal campo del modulo PDF usando C#
I seguenti semplici passaggi spiegano come analizzare il PDF e quindi estrarre i valori dei campi del modulo PDF in C#.
- Carica il file PDF utilizzando la classe Parser.
- Analizza il modulo PDF utilizzando il metodo ParseForm.
- Attraversa la raccolta analizzata per estrarre i valori del campo del modulo.
L’esempio di codice C# seguente mostra l’estrazione dei valori di campo dei moduli PDF compilati all’interno delle applicazioni .NET.
// Analizza il modulo PDF compilato per estrarre i valori dei campi in C#
using (Parser parser = new Parser("filePath/PDFForm.pdf"))
{
// Estrai i dati dal modulo PDF
DocumentData data = parser.ParseForm();
// Esegui l'iterazione sui dati dei campi del modulo PDF estratti
for (int i = 0; i < data.Count; i++)
{
Console.Write(data[i].Name + ": ");
PageTextArea area = data[i].PageArea as PageTextArea;
Console.WriteLine(area == null ? "Not a template field" : area.Text);
}
}
COMPANY: GroupDocs
EMAIL: everything@groupdocs.com
COUNTRY: Australia
Conclusione
Sono fiducioso che ora ti sentirai a tuo agio nello sviluppare la tua applicazione basata su .NET in grado di analizzare i file PDF e recuperare i valori dai campi dei moduli PDF compilabili in modo rapido e preciso. Per aggiungere altre funzionalità, puoi saperne di più sull’API negli articoli documentazione e negli esempi C# su GitHub.
Per domande e risposte rapide, tieniti in contatto sul forum.