この記事では、** PDFドキュメントを読み取って解析し、プログラムでC#でPDFフォームフィールドの値を抽出する方法**を学習します。以前、JavaでPDFフォームから値を抽出する方法を見てきました。これらの記事を読んだ後、フィードバックフォームに記入した場合は、分析のために.NETおよびJavaアプリケーション内の値を抽出するか、データベースに保存することができます。

PDFフォームを解析してC#で値を抽出する

PDFフォームから値を解析および抽出するための.NETAPI

GroupDocs.Parser for .NETは、.NETアプリケーション用の使いやすく強力な解析およびデータ抽出APIです。ワードプロセッシングやPDFドキュメント、スプレッドシート、プレゼンテーション、メール、マークアップ、電子書籍、アーカイブなどからのテキスト、メタデータ、画像の抽出をサポートしています。重要な機能の1つであり、以下にも示されます。これは、入力可能なPDFフォームを解析して、小さなC#コードを使用してフォームフィールドの値を抽出することです。

下記およびその他のAPIの例をテストするには、NuGetからAPIをダウンロードしてインストールするか、GroupDocsダウンロードから直接ダウンロードしてください。

PM> Install-Package GroupDocs.Parser

C#を使用してPDFフォームフィールドからデータを抽出する

次の簡単な手順は、PDFを解析してからC#でPDFフォームフィールドの値を抽出する方法を示しています。

  • Parserクラスを使用してPDFファイルをロードします。
  • ParseFormメソッドを使用してPDFフォームを解析します。
  • 解析されたコレクションをトラバースして、フォームフィールドの値を抽出します。

次のC#コード例は、.NETアプリケーション内で入力されたPDFフォームのフィールド値の抽出を示しています。

// 記入済みのPDFフォームを解析して、C#でフィールド値を抽出します
using (Parser parser = new Parser("filePath/PDFForm.pdf"))
{
    // PDFフォームからデータを抽出する
    DocumentData data = parser.ParseForm();
    // 抽出されたPDFフォームフィールドデータを反復処理します
    for (int i = 0; i < data.Count; i++)
    {
        Console.Write(data[i].Name + ": ");
        PageTextArea area = data[i].PageArea as PageTextArea;
        Console.WriteLine(area == null ? "Not a template field" : area.Text);
    }
}
COMPANY: GroupDocs
EMAIL: everything@groupdocs.com
COUNTRY: Australia

結論

PDFファイルを解析し、入力可能なPDFフォームフィールドから値をすばやく正確にフェッチできる独自の.NETベースのアプリケーションを開発することに慣れることができると確信しています。さらに機能を追加するには、ドキュメントの記事とGitHubのC#の例からAPIの詳細を学ぶことができます。

質問や迅速な対応については、フォーラムまでお問い合わせください。

関連項目