In dit artikel leren we hoe we PDF-documenten kunnen lezen en ontleden en vervolgens programmatisch PDF-formulierveldwaarden kunnen extraheren in C#. Eerder hebben we gezien hoe u waarden kunt extraheren uit PDF-formulieren in Java. Als u na het lezen van deze artikelen feedbackformulieren heeft ingevuld, kunt u de waarden uit uw .NET- en Java-applicaties extraheren voor analyse of opslaan in de database.

Parseer PDF-formulieren om waarden te extraheren in C#

.NET API om waarden uit PDF-formulieren te ontleden en te extraheren

GroupDocs.Parser for .NET is een gebruiksvriendelijke en krachtige API voor parsering en gegevensextractie voor de .NET-toepassingen. Het ondersteunt tekst-, metadata- en beeldextractie uit tekstverwerkings- en PDF-documenten, spreadsheets, presentaties, e-mails, markeringen, e-boeken, archieven en nog veel meer. Een van de belangrijkste functies, die ook hieronder wordt getoond, is het ontleden van invulbare PDF-formulieren om de formulierveldwaarden te extraheren met behulp van een klein stukje C#-code.

Om de onderstaande en andere voorbeelden van de API te testen, kunt u de API downloaden en installeren vanaf NuGet of rechtstreeks download vanuit GroupDocs-downloads.

PM> Install-Package GroupDocs.Parser

Extraheer gegevens uit het PDF-formulierveld met C#

De volgende eenvoudige stappen laten zien hoe PDF moet worden geparseerd en vervolgens PDF-formulierveldwaarden in C# moeten worden geëxtraheerd.

  • Laad het PDF-bestand met de klasse Parser.
  • Parseer het PDF-formulier met de methode ParseForm.
  • Doorloop de geparseerde verzameling om de formulierveldwaarden te extraheren.

Het volgende C#-codevoorbeeld toont de extractie van veldwaarden van ingevulde PDF-formulieren binnen .NET-toepassingen.

// Parseer het ingevulde PDF-formulier om veldwaarden in C# te extraheren
using (Parser parser = new Parser("filePath/PDFForm.pdf"))
{
    // Extraheer gegevens uit PDF-formulier
    DocumentData data = parser.ParseForm();
    // Herhaal de geëxtraheerde PDF-formulierveldgegevens
    for (int i = 0; i < data.Count; i++)
    {
        Console.Write(data[i].Name + ": ");
        PageTextArea area = data[i].PageArea as PageTextArea;
        Console.WriteLine(area == null ? "Not a template field" : area.Text);
    }
}
COMPANY: GroupDocs
EMAIL: everything@groupdocs.com
COUNTRY: Australia

Conclusie

Ik ben ervan overtuigd dat u zich nu op uw gemak zult voelen bij het ontwikkelen van uw eigen op .NET gebaseerde applicatie die snel en nauwkeurig PDF-bestanden kan ontleden en waarden kan ophalen uit invulbare PDF-formuliervelden. Om meer functies toe te voegen, kun je meer leren over de API in de documentatie artikelen en C#-voorbeelden op GitHub.

Neem voor vragen en snelle reacties contact op via het forum.

Zie ook