In dit artikel leren we hoe we PDF-documenten kunnen lezen en ontleden en vervolgens programmatisch PDF-formulierveldwaarden kunnen extraheren in C#. Eerder hebben we gezien hoe u waarden kunt extraheren uit PDF-formulieren in Java. Als u na het lezen van deze artikelen feedbackformulieren heeft ingevuld, kunt u de waarden uit uw .NET- en Java-applicaties extraheren voor analyse of opslaan in de database.
.NET API om waarden uit PDF-formulieren te ontleden en te extraheren
GroupDocs.Parser for .NET is een gebruiksvriendelijke en krachtige API voor parsering en gegevensextractie voor de .NET-toepassingen. Het ondersteunt tekst-, metadata- en beeldextractie uit tekstverwerkings- en PDF-documenten, spreadsheets, presentaties, e-mails, markeringen, e-boeken, archieven en nog veel meer. Een van de belangrijkste functies, die ook hieronder wordt getoond, is het ontleden van invulbare PDF-formulieren om de formulierveldwaarden te extraheren met behulp van een klein stukje C#-code.
Om de onderstaande en andere voorbeelden van de API te testen, kunt u de API downloaden en installeren vanaf NuGet of rechtstreeks download vanuit GroupDocs-downloads.
PM> Install-Package GroupDocs.Parser
Extraheer gegevens uit het PDF-formulierveld met C#
De volgende eenvoudige stappen laten zien hoe PDF moet worden geparseerd en vervolgens PDF-formulierveldwaarden in C# moeten worden geëxtraheerd.
- Laad het PDF-bestand met de klasse Parser.
- Parseer het PDF-formulier met de methode ParseForm.
- Doorloop de geparseerde verzameling om de formulierveldwaarden te extraheren.
Het volgende C#-codevoorbeeld toont de extractie van veldwaarden van ingevulde PDF-formulieren binnen .NET-toepassingen.
// Parseer het ingevulde PDF-formulier om veldwaarden in C# te extraheren
using (Parser parser = new Parser("filePath/PDFForm.pdf"))
{
// Extraheer gegevens uit PDF-formulier
DocumentData data = parser.ParseForm();
// Herhaal de geëxtraheerde PDF-formulierveldgegevens
for (int i = 0; i < data.Count; i++)
{
Console.Write(data[i].Name + ": ");
PageTextArea area = data[i].PageArea as PageTextArea;
Console.WriteLine(area == null ? "Not a template field" : area.Text);
}
}
COMPANY: GroupDocs
EMAIL: everything@groupdocs.com
COUNTRY: Australia
Conclusie
Ik ben ervan overtuigd dat u zich nu op uw gemak zult voelen bij het ontwikkelen van uw eigen op .NET gebaseerde applicatie die snel en nauwkeurig PDF-bestanden kan ontleden en waarden kan ophalen uit invulbare PDF-formuliervelden. Om meer functies toe te voegen, kun je meer leren over de API in de documentatie artikelen en C#-voorbeelden op GitHub.
Neem voor vragen en snelle reacties contact op via het forum.