V tomto článku se naučíme, jak číst a analyzovat dokumenty PDF a poté programově extrahovat hodnoty polí formuláře PDF v C#. Dříve jsme viděli jak extrahovat hodnoty z formulářů PDF v Java. Po přečtení těchto článků, pokud jste vyplnili formuláře zpětné vazby, můžete extrahovat hodnoty ze svých aplikací .NET & Java pro analýzu nebo je uložit do databáze.
.NET API pro analýzu a extrahování hodnot z formulářů PDF
GroupDocs.Parser for .NET je snadno použitelné a výkonné rozhraní API pro analýzu a extrakci dat pro aplikace .NET. Podporuje extrakci textu, metadat a obrázků z textových a PDF dokumentů, tabulek, prezentací, e-mailů, značek, e-knih, archivů a mnoha dalších. Jednou z významných funkcí, která bude také uvedena níže, je analýza vyplnitelných formulářů PDF pro extrahování hodnot polí formuláře pomocí malého kousku kódu C#.
Chcete-li otestovat níže uvedené a další příklady rozhraní API, můžete si stáhnout a nainstalovat rozhraní API z NuGet nebo přímo stáhnout ze souborů ke stažení GroupDocs.
PM> Install-Package GroupDocs.Parser
Extrahujte data z pole formuláře PDF pomocí C#
Následující jednoduché kroky říkají, jak analyzovat PDF a poté extrahovat hodnoty polí formuláře PDF v C#.
- Načtěte soubor PDF pomocí třídy Parser.
- Analyzujte formulář PDF pomocí metody ParseForm.
- Projděte analyzovanou kolekci a extrahujte hodnoty polí formuláře.
Následující příklad kódu C# ukazuje extrakci hodnot polí vyplněných formulářů PDF v aplikacích .NET.
// Analyzujte vyplněný formulář PDF a extrahujte hodnoty polí v C#
using (Parser parser = new Parser("filePath/PDFForm.pdf"))
{
// Extrahujte data z formuláře PDF
DocumentData data = parser.ParseForm();
// Iterujte extrahovaná data polí formuláře PDF
for (int i = 0; i < data.Count; i++)
{
Console.Write(data[i].Name + ": ");
PageTextArea area = data[i].PageArea as PageTextArea;
Console.WriteLine(area == null ? "Not a template field" : area.Text);
}
}
COMPANY: GroupDocs
EMAIL: everything@groupdocs.com
COUNTRY: Australia
Závěr
Jsem přesvědčen, že se nyní budete cítit pohodlně při vývoji své vlastní aplikace založené na .NET, která dokáže rychle a přesně analyzovat soubory PDF a načítat hodnoty z polí formuláře PDF, která lze vyplnit. Chcete-li přidat další funkce, můžete se dozvědět více o rozhraní API v článcích dokumentace a příkladech C# na GitHub.
Pro dotazy a rychlou odpověď nás kontaktujte na fóru.