在本文中,我們將學習如何讀取和解析 PDF 文檔,然後在 C# 中以編程方式提取 PDF 表單字段值。早些時候,我們已經看到了如何在 Java 中從 PDF 表單中提取值。閱讀這些文章後,如果您填寫了反饋表,則可以提取 .NET 和 Java 應用程序中的值進行分析或將它們保存在數據庫中。

解析 PDF 表單以在 C# 中提取值

.NET API 解析和提取 PDF 表單中的值

GroupDocs.Parser for .NET 是一種易於使用且功能強大的 .NET 應用程序解析和數據提取 API。它支持從文字處理和 PDF 文檔、電子表格、演示文稿、電子郵件、標記、電子書、檔案等中提取文本、元數據和圖像。下面將顯示的重要功能之一是解析可填寫的 PDF 表單,以使用一小段 C# 代碼提取表單字段值。

要測試下面提到的 API 示例和其他示例,您可以從 NuGet 下載並安裝 API 或直接從 GroupDocs 下載 下載

PM> Install-Package GroupDocs.Parser

使用 C# 從 PDF 表單字段中提取數據

以下簡單步驟說明如何在 C# 中解析 PDF,然後提取 PDF 表單字段值。

  • 使用 Parser 類加載 PDF 文件。
  • 使用 ParseForm 方法解析 PDF 表單。
  • 遍歷解析的集合以提取表單字段值。

以下 C# 代碼示例顯示了在 .NET 應用程序中提取填寫的 PDF 表單的字段值。

// 解析填寫的 PDF 表單以在 C# 中提取字段值
using (Parser parser = new Parser("filePath/PDFForm.pdf"))
{
    // 從 PDF 表單中提取數據
    DocumentData data = parser.ParseForm();
    // 迭代提取的 PDF 表單字段數據
    for (int i = 0; i < data.Count; i++)
    {
        Console.Write(data[i].Name + ": ");
        PageTextArea area = data[i].PageArea as PageTextArea;
        Console.WriteLine(area == null ? "Not a template field" : area.Text);
    }
}
COMPANY: GroupDocs
EMAIL: everything@groupdocs.com
COUNTRY: Australia

結論

我相信,您現在可以輕鬆開發自己的基於 .NET 的應用程序,該應用程序可以解析 PDF 文件并快速準確地從可填寫的 PDF 表單字段中獲取值。要添加更多功能,您可以從 GitHub 上的 文檔 文章和 C# 示例中了解有關 API 的更多信息。

如需查詢和快速回复,請在 論壇 上聯繫。

也可以看看