在本文中,我们将学习如何读取和解析 PDF 文档,然后在 C# 中以编程方式提取 PDF 表单字段值。早些时候,我们已经看到如何在 Java 中从 PDF 表单中提取值。阅读这些文章后,如果您填写了反馈表,您可以提取 .NET 和 Java 应用程序中的值进行分析或将它们保存在数据库中。
.NET API 从 PDF 表单中解析和提取值
GroupDocs.Parser for .NET 是一个易于使用且功能强大的 .NET 应用程序解析和数据提取 API。它支持从文字处理和 PDF 文档、电子表格、演示文稿、电子邮件、标记、电子书、档案等中提取文本、元数据和图像。其中一个重要的功能也将在下面显示,它是使用一小段 C# 代码解析可填写的 PDF 表单以提取表单字段值。
要测试下面提到的 API 示例和其他示例,您可以从 NuGet 下载并安装 API,或直接从 GroupDocs 下载中下载。
PM> Install-Package GroupDocs.Parser
使用 C# 从 PDF 表单字段中提取数据
以下简单步骤介绍了如何解析 PDF,然后在 C# 中提取 PDF 表单字段值。
以下 C# 代码示例显示了在 .NET 应用程序中提取已填充 PDF 表单的字段值。
// 解析填充的 PDF 表单以提取 C# 中的字段值
using (Parser parser = new Parser("filePath/PDFForm.pdf"))
{
// 从 PDF 表单中提取数据
DocumentData data = parser.ParseForm();
// 迭代提取的 PDF 表单字段数据
for (int i = 0; i < data.Count; i++)
{
Console.Write(data[i].Name + ": ");
PageTextArea area = data[i].PageArea as PageTextArea;
Console.WriteLine(area == null ? "Not a template field" : area.Text);
}
}
COMPANY: GroupDocs
EMAIL: everything@groupdocs.com
COUNTRY: Australia
结论
我相信,您现在可以轻松地开发自己的基于 .NET 的应用程序,该应用程序可以解析 PDF 文件并快速准确地从可填写的 PDF 表单字段中获取值。要添加更多功能,您可以从 文档 文章和 GitHub 上的 C# 示例中了解有关 API 的更多信息。
如需查询和快速回复,请在 论坛 上联系。