In diesem Artikel erfahren wir, wie PDF-Dokumente gelesen und analysiert und dann PDF-Formularfeldwerte in C# programmgesteuert extrahiert werden. Zuvor haben wir gesehen wie man Werte aus PDF-Formularen in Java extrahiert. Nachdem Sie diese Artikel gelesen haben und Feedbackformulare ausgefüllt haben, können Sie die Werte in Ihren .NET- und Java-Anwendungen zur Analyse extrahieren oder in der Datenbank speichern.
.NET-API zum Analysieren und Extrahieren von Werten aus PDF-Formularen
GroupDocs.Parser for .NET ist eine benutzerfreundliche und leistungsstarke API zum Analysieren und Extrahieren von Daten für .NET-Anwendungen. Es unterstützt die Text-, Metadaten- und Bildextraktion aus Textverarbeitungs- und PDF-Dokumenten, Tabellenkalkulationen, Präsentationen, E-Mails, Markups, E-Books, Archiven und vielem mehr. Eines der wichtigsten Features, das auch unten gezeigt wird, ist das Parsen von ausfüllbaren PDF-Formularen, um die Formularfeldwerte mit einem kleinen Stück C#-Code zu extrahieren.
Um die unten genannten und andere Beispiele der API zu testen, können Sie die API von NuGet herunterladen und installieren oder direkt von GroupDocs-Downloads herunterladen.
PM> Install-Package GroupDocs.Parser
Extrahieren Sie Daten aus dem PDF-Formularfeld mit C#
Die folgenden einfachen Schritte zeigen, wie Sie PDF analysieren und dann PDF-Formularfeldwerte in C# extrahieren.
- Laden Sie die PDF-Datei mit der Klasse Parser.
- Analysieren Sie das PDF-Formular mit der Methode ParseForm.
- Durchlaufen Sie die analysierte Sammlung, um die Formularfeldwerte zu extrahieren.
Das folgende C#-Codebeispiel zeigt die Extraktion von Feldwerten aus ausgefüllten PDF-Formularen innerhalb von .NET-Anwendungen.
// Analysieren Sie das ausgefüllte PDF-Formular, um Feldwerte in C# zu extrahieren
using (Parser parser = new Parser("filePath/PDFForm.pdf"))
{
// Daten aus PDF-Formular extrahieren
DocumentData data = parser.ParseForm();
// Iterieren Sie über die extrahierten PDF-Formularfelddaten
for (int i = 0; i < data.Count; i++)
{
Console.Write(data[i].Name + ": ");
PageTextArea area = data[i].PageArea as PageTextArea;
Console.WriteLine(area == null ? "Not a template field" : area.Text);
}
}
COMPANY: GroupDocs
EMAIL: everything@groupdocs.com
COUNTRY: Australia
Fazit
Ich bin zuversichtlich, dass Sie sich jetzt sicher fühlen werden, Ihre eigene .NET-basierte Anwendung zu entwickeln, die PDF-Dateien analysieren und Werte aus ausfüllbaren PDF-Formularfeldern schnell und präzise abrufen kann. Um weitere Funktionen hinzuzufügen, können Sie mehr über die API in den Dokumentation-Artikeln und C#-Beispielen auf GitHub erfahren.
Für Fragen und schnelle Antworten kontaktieren Sie uns im Forum.