对于 PDF 和 Word 文档的表格形式的数据,您有时需要将其转换为 Excel 电子表格。我们需要将尽可能多的文档自动转换为电子表格或多个工作簿。本文将讨论如何以编程方式将 Word 文档转换为 Excel,以及如何将 PDF 文件转换为 Java 中的 Excel 电子表格。

在 Java 中将 Word 和 PDF 转换为 Excel

此处简要讨论以下主题:

用于转换为电子表格的 Java API

GroupDocs.Conversion for Java 是允许您在 Java 应用程序中将 PDF 和 Word 文档转换为电子表格的 API。 API 允许以多种文件格式进行文档和图像转换。一些受支持的文档格式包括文字处理文档、电子表格、演示文稿、电子书、AutoCAD 格式、PDF、电子邮件、网页、图像。

下载并配置

您可以从下载部分获取转换库,或在基于 Maven 的 Java 应用程序中添加以下 pom.xml 配置。之后,您可以尝试本文的示例以及 GitHub 上提供的更多示例。有关详细信息,您可以访问 API 参考

<repository>
	<id>GroupDocsJavaAPI</id>
	<name>GroupDocs Java API</name>
	<url>http://repository.groupdocs.com/repo/</url>
</repository>
<dependency>
        <groupId>com.groupdocs</groupId>
        <artifactId>groupdocs-conversion</artifactId>
        <version>21.4</version> 
</dependency>

在 Java 中将 PDF 转换为 Excel

可以按照以下步骤将任何 PDF 文档转换为 Excel 电子表格。

以下代码示例展示了如何将 PDF 文件转换为 Java 中的 Excel XLSX 电子表格。

// 在 Java 中将 PDF 文档转换为 Excel 电子表格
Converter converter = new Converter("document.pdf");
SpreadsheetConvertOptions options = new SpreadsheetConvertOptions();
converter.convert("pdfToExcel.xlsx", options);

在 Java 中将 Word 转换为 Excel

同样,任何 Word 文档都可以转换为 Excel 电子表格,方法与我们刚刚转换 PDF 文档的方式相同。提供正确的源文件并将其转换为 XLS 或 XLSX。

以下是将任何 DOC DOCX 文件转换为 Excel 电子表格的步骤。

  • 使用 Converter 类加载 DOC、DOCX 文件。
  • 使用 SpreadsheetConvertOptions 准备转换选项。
  • 使用选项调用Converter 类的convert 方法。

以下源代码显示了如何将 DOC 或 DOCX 文件转换为 Java 中的 Excel XLSX 格式。

// 在 Java 中将 Word 文档转换为 Excel 电子表格
Converter converter = new Converter("document.docx");
SpreadsheetConvertOptions options = new SpreadsheetConvertOptions();
converter.convert("wordToExcel.xlsx", options);

PDF 或 Word 到电子表格的转换,使用 Java 提供更多选项

您不必每次都转换整个文档。您可以只转换文档的选定页面。 API 让您可以使用各种选项转换文档,其中包括:

  • 开始页码
  • 页数
  • 特定页面用于转换。
  • 格式要转换成。
  • 密码 用于使文件受到保护。
  • 缩放使其变大或变小。
  • 水印在转换器文件上。

以下是如何在 Java 中将 PDF 文件的某些页面转换为具有不同缩放比例的 XLSX 格式的步骤。

// 使用一些选项将 PDF 文件的第二页转换为 Java 中的 Excel
Converter converter = new Converter("document.pdf");
SpreadsheetConvertOptions options = new SpreadsheetConvertOptions();
options.setPageNumber(2);
options.setPagesCount(1);
options.setFormat(SpreadsheetFileType.Xlsx);
options.setZoom(120);

converter.convert("pdfToExcelAdv.xlsx", options);

PDF 文件和转换后的电子表格作为输出显示在此处。它将 PDF 文件的第二页转换为 XLSX 格式。

以编程方式将 PDF 转换为 Excel XLS XLSX

获取免费 API 许可证

您可以 获得免费的临时许可证 以便在没有评估限制的情况下使用 API。

结论

在本文中,我们讨论了将 PDF 和 Word 文档转换为 Java 中的 Excel 电子表格。此外,我们还学习了如何使用水印、缩放等选项转换文档的任何部分,并使用密码保护对其进行保护。

有关更多选项和示例,请访问 文档GitHub 存储库。如需查询,请通过 论坛 联系我们。

也可以看看