この記事では、** PDFドキュメントを読み取って解析し、プログラムでC#でPDFフォームフィールドの値を抽出する方法**を学習します。以前、JavaでPDFフォームから値を抽出する方法を見てきました。これらの記事を読んだ後、フィードバックフォームに記入した場合は、分析のために.NETおよびJavaアプリケーション内の値を抽出するか、データベースに保存することができます。
PDFフォームから値を解析および抽出するための.NETAPI
GroupDocs.Parser for .NETは、.NETアプリケーション用の使いやすく強力な解析およびデータ抽出APIです。ワードプロセッシングやPDFドキュメント、スプレッドシート、プレゼンテーション、メール、マークアップ、電子書籍、アーカイブなどからのテキスト、メタデータ、画像の抽出をサポートしています。重要な機能の1つであり、以下にも示されます。これは、入力可能なPDFフォームを解析して、小さなC#コードを使用してフォームフィールドの値を抽出することです。
下記およびその他のAPIの例をテストするには、NuGetからAPIをダウンロードしてインストールするか、GroupDocsダウンロードから直接ダウンロードしてください。
PM> Install-Package GroupDocs.Parser
C#を使用してPDFフォームフィールドからデータを抽出する
次の簡単な手順は、PDFを解析してからC#でPDFフォームフィールドの値を抽出する方法を示しています。
- Parserクラスを使用してPDFファイルをロードします。
- ParseFormメソッドを使用してPDFフォームを解析します。
- 解析されたコレクションをトラバースして、フォームフィールドの値を抽出します。
次のC#コード例は、.NETアプリケーション内で入力されたPDFフォームのフィールド値の抽出を示しています。
// 記入済みのPDFフォームを解析して、C#でフィールド値を抽出します
using (Parser parser = new Parser("filePath/PDFForm.pdf"))
{
// PDFフォームからデータを抽出する
DocumentData data = parser.ParseForm();
// 抽出されたPDFフォームフィールドデータを反復処理します
for (int i = 0; i < data.Count; i++)
{
Console.Write(data[i].Name + ": ");
PageTextArea area = data[i].PageArea as PageTextArea;
Console.WriteLine(area == null ? "Not a template field" : area.Text);
}
}
COMPANY: GroupDocs
EMAIL: everything@groupdocs.com
COUNTRY: Australia
結論
PDFファイルを解析し、入力可能なPDFフォームフィールドから値をすばやく正確にフェッチできる独自の.NETベースのアプリケーションを開発することに慣れることができると確信しています。さらに機能を追加するには、ドキュメントの記事とGitHubのC#の例からAPIの詳細を学ぶことができます。
質問や迅速な対応については、フォーラムまでお問い合わせください。