W tym artykule dowiemy się, jak odczytywać i analizować dokumenty PDF, a następnie programowo wyodrębniać wartości pól formularza PDF w języku C#. Wcześniej widzieliśmy jak wyodrębnić wartości z formularzy PDF w Javie. Po przeczytaniu tych artykułów, jeśli wypełniłeś formularze zwrotne, możesz wyodrębnić wartości z aplikacji .NET i Java do analizy lub zapisać je w bazie danych.

Analizuj formularze PDF, aby wyodrębnić wartości w C#

.NET API do analizowania i wyodrębniania wartości z formularzy PDF

GroupDocs.Parser for .NET to łatwy w użyciu i wydajny interfejs API do analizy i ekstrakcji danych dla aplikacji .NET. Obsługuje wyodrębnianie tekstu, metadanych i obrazów z dokumentów edytorów tekstu i PDF, arkuszy kalkulacyjnych, prezentacji, wiadomości e-mail, znaczników, e-booków, archiwów i wielu innych. Jedną z istotnych funkcji, która zostanie również pokazana poniżej, jest analizowanie formularzy PDF do wypełnienia w celu wyodrębnienia wartości pól formularza za pomocą małego fragmentu kodu C#.

Aby przetestować wymienione poniżej i inne przykłady interfejsu API, możesz pobrać i zainstalować interfejs API z NuGet lub bezpośrednio pobierz z plików do pobrania GroupDocs.

PM> Install-Package GroupDocs.Parser

Wyodrębnij dane z pola formularza PDF za pomocą C#

Poniższe proste kroki pokazują, jak przeanalizować plik PDF, a następnie wyodrębnić wartości pól formularza PDF w języku C#.

  • Załaduj plik PDF za pomocą klasy Parser.
  • Przeanalizuj formularz PDF za pomocą metody ParseForm.
  • Przejrzyj przeanalizowaną kolekcję, aby wyodrębnić wartości pól formularza.

Poniższy przykład kodu C# pokazuje wyodrębnianie wartości pól wypełnionych formularzy PDF w aplikacjach .NET.

// Przeanalizuj wypełniony formularz PDF, aby wyodrębnić wartości pól w języku C#
using (Parser parser = new Parser("filePath/PDFForm.pdf"))
{
    // Wyodrębnij dane z formularza PDF
    DocumentData data = parser.ParseForm();
    // Iteruj po wyodrębnionych danych pól formularza PDF
    for (int i = 0; i < data.Count; i++)
    {
        Console.Write(data[i].Name + ": ");
        PageTextArea area = data[i].PageArea as PageTextArea;
        Console.WriteLine(area == null ? "Not a template field" : area.Text);
    }
}
COMPANY: GroupDocs
EMAIL: everything@groupdocs.com
COUNTRY: Australia

Wniosek

Jestem przekonany, że teraz poczujesz się komfortowo, tworząc własną aplikację opartą na .NET, która może szybko i precyzyjnie analizować pliki PDF i pobierać wartości z pól formularzy PDF, które można wypełnić. Aby dodać więcej funkcji, możesz dowiedzieć się więcej o interfejsie API z dokumentacji artykułów i przykładów C# na GitHub.

W przypadku pytań i szybkiej odpowiedzi skontaktuj się z nami na forum.

Zobacz też