在本文中,我们将学习如何读取和解析 PDF 文档,然后在 C# 中以编程方式提取 PDF 表单字段值。早些时候,我们已经看到如何在 Java 中从 PDF 表单中提取值。阅读这些文章后,如果您填写了反馈表,您可以提取 .NET 和 Java 应用程序中的值进行分析或将它们保存在数据库中。

解析 PDF 表单以提取 C# 中的值

.NET API 从 PDF 表单中解析和提取值

GroupDocs.Parser for .NET 是一个易于使用且功能强大的 .NET 应用程序解析和数据提取 API。它支持从文字处理和 PDF 文档、电子表格、演示文稿、电子邮件、标记、电子书、档案等中提取文本、元数据和图像。其中一个重要的功能也将在下面显示,它是使用一小段 C# 代码解析可填写的 PDF 表单以提取表单字段值。

要测试下面提到的 API 示例和其他示例,您可以从 NuGet 下载并安装 API,或直接从 GroupDocs 下载中下载

PM> Install-Package GroupDocs.Parser

使用 C# 从 PDF 表单字段中提取数据

以下简单步骤介绍了如何解析 PDF,然后在 C# 中提取 PDF 表单字段值。

  • 使用 Parser 类加载 PDF 文件。
  • 使用 ParseForm 方法解析 PDF 表单。
  • 遍历解析后的集合,提取表单字段值。

以下 C# 代码示例显示了在 .NET 应用程序中提取已填充 PDF 表单的字段值。

// 解析填充的 PDF 表单以提取 C# 中的字段值
using (Parser parser = new Parser("filePath/PDFForm.pdf"))
{
    // 从 PDF 表单中提取数据
    DocumentData data = parser.ParseForm();
    // 迭代提取的 PDF 表单字段数据
    for (int i = 0; i < data.Count; i++)
    {
        Console.Write(data[i].Name + ": ");
        PageTextArea area = data[i].PageArea as PageTextArea;
        Console.WriteLine(area == null ? "Not a template field" : area.Text);
    }
}
COMPANY: GroupDocs
EMAIL: everything@groupdocs.com
COUNTRY: Australia

结论

我相信,您现在可以轻松地开发自己的基于 .NET 的应用程序,该应用程序可以解析 PDF 文件并快速准确地从可填写的 PDF 表单字段中获取值。要添加更多功能,您可以从 文档 文章和 GitHub 上的 C# 示例中了解有关 API 的更多信息。

如需查询和快速回复,请在 论坛 上联系。

也可以看看