In diesem Artikel erfahren wir, wie PDF-Dokumente gelesen und analysiert und dann PDF-Formularfeldwerte in C# programmgesteuert extrahiert werden. Zuvor haben wir gesehen wie man Werte aus PDF-Formularen in Java extrahiert. Nachdem Sie diese Artikel gelesen haben und Feedbackformulare ausgefüllt haben, können Sie die Werte in Ihren .NET- und Java-Anwendungen zur Analyse extrahieren oder in der Datenbank speichern.

Analysieren Sie PDF-Formulare, um Werte in C# zu extrahieren

.NET-API zum Analysieren und Extrahieren von Werten aus PDF-Formularen

GroupDocs.Parser for .NET ist eine benutzerfreundliche und leistungsstarke API zum Analysieren und Extrahieren von Daten für .NET-Anwendungen. Es unterstützt die Text-, Metadaten- und Bildextraktion aus Textverarbeitungs- und PDF-Dokumenten, Tabellenkalkulationen, Präsentationen, E-Mails, Markups, E-Books, Archiven und vielem mehr. Eines der wichtigsten Features, das auch unten gezeigt wird, ist das Parsen von ausfüllbaren PDF-Formularen, um die Formularfeldwerte mit einem kleinen Stück C#-Code zu extrahieren.

Um die unten genannten und andere Beispiele der API zu testen, können Sie die API von NuGet herunterladen und installieren oder direkt von GroupDocs-Downloads herunterladen.

PM> Install-Package GroupDocs.Parser

Extrahieren Sie Daten aus dem PDF-Formularfeld mit C#

Die folgenden einfachen Schritte zeigen, wie Sie PDF analysieren und dann PDF-Formularfeldwerte in C# extrahieren.

  • Laden Sie die PDF-Datei mit der Klasse Parser.
  • Analysieren Sie das PDF-Formular mit der Methode ParseForm.
  • Durchlaufen Sie die analysierte Sammlung, um die Formularfeldwerte zu extrahieren.

Das folgende C#-Codebeispiel zeigt die Extraktion von Feldwerten aus ausgefüllten PDF-Formularen innerhalb von .NET-Anwendungen.

// Analysieren Sie das ausgefüllte PDF-Formular, um Feldwerte in C# zu extrahieren
using (Parser parser = new Parser("filePath/PDFForm.pdf"))
{
    // Daten aus PDF-Formular extrahieren
    DocumentData data = parser.ParseForm();
    // Iterieren Sie über die extrahierten PDF-Formularfelddaten
    for (int i = 0; i < data.Count; i++)
    {
        Console.Write(data[i].Name + ": ");
        PageTextArea area = data[i].PageArea as PageTextArea;
        Console.WriteLine(area == null ? "Not a template field" : area.Text);
    }
}
COMPANY: GroupDocs
EMAIL: everything@groupdocs.com
COUNTRY: Australia

Fazit

Ich bin zuversichtlich, dass Sie sich jetzt sicher fühlen werden, Ihre eigene .NET-basierte Anwendung zu entwickeln, die PDF-Dateien analysieren und Werte aus ausfüllbaren PDF-Formularfeldern schnell und präzise abrufen kann. Um weitere Funktionen hinzuzufügen, können Sie mehr über die API in den Dokumentation-Artikeln und C#-Beispielen auf GitHub erfahren.

Für Fragen und schnelle Antworten kontaktieren Sie uns im Forum.

Siehe auch