V tomto článku se naučíme, jak číst a analyzovat dokumenty PDF a poté programově extrahovat hodnoty polí formuláře PDF v C#. Dříve jsme viděli jak extrahovat hodnoty z formulářů PDF v Java. Po přečtení těchto článků, pokud jste vyplnili formuláře zpětné vazby, můžete extrahovat hodnoty ze svých aplikací .NET & Java pro analýzu nebo je uložit do databáze.

Analyzujte formuláře PDF pro extrahování hodnot v C#

.NET API pro analýzu a extrahování hodnot z formulářů PDF

GroupDocs.Parser for .NET je snadno použitelné a výkonné rozhraní API pro analýzu a extrakci dat pro aplikace .NET. Podporuje extrakci textu, metadat a obrázků z textových a PDF dokumentů, tabulek, prezentací, e-mailů, značek, e-knih, archivů a mnoha dalších. Jednou z významných funkcí, která bude také uvedena níže, je analýza vyplnitelných formulářů PDF pro extrahování hodnot polí formuláře pomocí malého kousku kódu C#.

Chcete-li otestovat níže uvedené a další příklady rozhraní API, můžete si stáhnout a nainstalovat rozhraní API z NuGet nebo přímo stáhnout ze souborů ke stažení GroupDocs.

PM> Install-Package GroupDocs.Parser

Extrahujte data z pole formuláře PDF pomocí C#

Následující jednoduché kroky říkají, jak analyzovat PDF a poté extrahovat hodnoty polí formuláře PDF v C#.

  • Načtěte soubor PDF pomocí třídy Parser.
  • Analyzujte formulář PDF pomocí metody ParseForm.
  • Projděte analyzovanou kolekci a extrahujte hodnoty polí formuláře.

Následující příklad kódu C# ukazuje extrakci hodnot polí vyplněných formulářů PDF v aplikacích .NET.

// Analyzujte vyplněný formulář PDF a extrahujte hodnoty polí v C#
using (Parser parser = new Parser("filePath/PDFForm.pdf"))
{
    // Extrahujte data z formuláře PDF
    DocumentData data = parser.ParseForm();
    // Iterujte extrahovaná data polí formuláře PDF
    for (int i = 0; i < data.Count; i++)
    {
        Console.Write(data[i].Name + ": ");
        PageTextArea area = data[i].PageArea as PageTextArea;
        Console.WriteLine(area == null ? "Not a template field" : area.Text);
    }
}
COMPANY: GroupDocs
EMAIL: everything@groupdocs.com
COUNTRY: Australia

Závěr

Jsem přesvědčen, že se nyní budete cítit pohodlně při vývoji své vlastní aplikace založené na .NET, která dokáže rychle a přesně analyzovat soubory PDF a načítat hodnoty z polí formuláře PDF, která lze vyplnit. Chcete-li přidat další funkce, můžete se dozvědět více o rozhraní API v článcích dokumentace a příkladech C# na GitHub.

Pro dotazy a rychlou odpověď nás kontaktujte na fóru.

Viz také