在本文中,我們將學習如何讀取和解析 PDF 文檔,然後在 C# 中以編程方式提取 PDF 表單字段值。早些時候,我們已經看到了如何在 Java 中從 PDF 表單中提取值。閱讀這些文章後,如果您填寫了反饋表,則可以提取 .NET 和 Java 應用程序中的值進行分析或將它們保存在數據庫中。
.NET API 解析和提取 PDF 表單中的值
GroupDocs.Parser for .NET 是一種易於使用且功能強大的 .NET 應用程序解析和數據提取 API。它支持從文字處理和 PDF 文檔、電子表格、演示文稿、電子郵件、標記、電子書、檔案等中提取文本、元數據和圖像。下面將顯示的重要功能之一是解析可填寫的 PDF 表單,以使用一小段 C# 代碼提取表單字段值。
要測試下面提到的 API 示例和其他示例,您可以從 NuGet 下載並安裝 API 或直接從 GroupDocs 下載 下載。
PM> Install-Package GroupDocs.Parser
使用 C# 從 PDF 表單字段中提取數據
以下簡單步驟說明如何在 C# 中解析 PDF,然後提取 PDF 表單字段值。
以下 C# 代碼示例顯示了在 .NET 應用程序中提取填寫的 PDF 表單的字段值。
// 解析填寫的 PDF 表單以在 C# 中提取字段值
using (Parser parser = new Parser("filePath/PDFForm.pdf"))
{
// 從 PDF 表單中提取數據
DocumentData data = parser.ParseForm();
// 迭代提取的 PDF 表單字段數據
for (int i = 0; i < data.Count; i++)
{
Console.Write(data[i].Name + ": ");
PageTextArea area = data[i].PageArea as PageTextArea;
Console.WriteLine(area == null ? "Not a template field" : area.Text);
}
}
COMPANY: GroupDocs
EMAIL: everything@groupdocs.com
COUNTRY: Australia
結論
我相信,您現在可以輕鬆開發自己的基於 .NET 的應用程序,該應用程序可以解析 PDF 文件并快速準確地從可填寫的 PDF 表單字段中獲取值。要添加更多功能,您可以從 GitHub 上的 文檔 文章和 C# 示例中了解有關 API 的更多信息。
如需查詢和快速回复,請在 論壇 上聯繫。