如果您有 PDF 或 Word 文档格式的表格数据,您肯定需要将其转换为 Excel 电子表格。当有许多电子表格或多个工作簿时,这种情况会变得复杂。你肯定需要自动化这个过程。在本文中,我们将了解如何将 PDF 转换为 Excel,以及如何使用 .NET API 在 C# 中以编程方式将 Word 文档转换为 Excel 电子表格。

在 C# 中将 Word 和 PDF 转换为 Excel

以下是本文简要讨论的主题:

  • .NET API – 将文档转换为电子表格
  • 将 PDF 转换为 Excel
  • 将 Word 转换为 Excel
  • PDF 或 Word 到电子表格的转换具有更多选项

.NET API - 转换为电子表格格式

在本文中,我将使用 GroupDocs.Conversion for .NET 使用 C# 将 PDF 和 Word 文档转换为电子表格。它是功能丰富的 API,允许以多种文件格式进行文档和图像转换。为了突出某些格式,API 支持文字处理文档、电子表格、演示文稿、AutoCAD 绘图、电子书、PDF、电子邮件文件、网页、图像、photoshop 文件和许多其他文档格式。

下载部分 下载 DLLsMSI 安装程序,或通过 NuGet 在您的 .NET 应用程序中安装 API。

PM> Install-Package GroupDocs.Conversion

在 C# 中将 PDF 转换为 Excel

以下是将 PDF 文档转换为 Excel 电子表格的步骤。

以下代码示例展示了如何使用 C# 将 PDF 文件转换为 Excel XLSX 格式。

// 在 C# 中将 PDF 文档转换为 Excel 电子表格
using (Converter converter = new Converter("document.pdf"))
{
    SpreadsheetConvertOptions options = new SpreadsheetConvertOptions();
    converter.Convert("outputpath/convertedSpreadsheet.xlsx", options);
}

在 C# 中将 Word 转换为 Excel

您可以使用与我们在上面转换 PDF 文件相同的方式将任何 Word 文档转换为 Excel 电子表格。我们只需提供正确的源文件即可转换为 XLS 或 XLSX。

以下是将 DOC DOCX 格式的 Word 文档转换为 Excel 电子表格的步骤。

以下代码示例展示了如何使用 C# 将 DOC 或 DOCX 文件转换为 Excel XLSX 格式。

// 在 C# 中将 Word 文档转换为 Excel 电子表格
using (Converter converter = new Converter("document.docx"))
{
    SpreadsheetConvertOptions options = new SpreadsheetConvertOptions();
    converter.Convert("outputpath/convertedSpreadsheet.xlsx", options);
}

PDF 或 Word 到电子表格的转换,使用 C# 提供更多选项

您只能转换文档的某些选定页面。 API 让您可以使用不同的选项转换文档,包括:

  • 开始页码
  • 页数要转换。
  • 特定页面用于转换。
  • 格式要转换成。
  • 密码 用于使文件受到保护。
  • 缩放使其变大或变小。
  • 水印在转换器文件上。

以下是如何使用 C# 将 PDF 文件的某些页面转换为具有不同缩放比例的 XLSX 格式的步骤。

// 使用一些选项在 C# 中将 PDF 文件的第二页转换为 Excel
using (Converter converter = new Converter("document.pdf"))
{
    SpreadsheetConvertOptions options = new SpreadsheetConvertOptions
    {
        PageNumber = 2,
        PagesCount = 1,
        Format = SpreadsheetFileType.Xlsx,
        Zoom = 150
    };
    converter.Convert("outputpath/convertedSpreadsheet.xlsx", options);
}

这是使用上述代码输出的 PDF 文件和转换后的电子表格。它将 PDF 文件的第二页转换为 XLSX 格式。

以编程方式将 PDF 转换为 Excel XLS XLSX

获取免费 API 许可证

您可以 获得免费的临时许可证 以便在没有评估限制的情况下使用 API。

结论

在本文中,您学习了如何使用 C# 在 Excel 电子表格中转换 PDF 和 Word 文档。此外,您还看到了我们如何使用缩放、水印等选项转换文档的任何部分,并使其受密码保护。您现在可以开始构建您自己的基于 .NET 的文档转换应用程序或将这些功能集成到您现有的应用程序中。

有关更多详细信息、选项和示例,您可以访问 文档GitHub 存储库。如需进一步查询,请联系 论坛 上的支持人员。

也可以看看