对于 PDF 和 Word 文档的表格形式的数据,您有时需要将其转换为 Excel 电子表格。我们需要将尽可能多的文档自动转换为电子表格或多个工作簿。本文将讨论如何以编程方式将 Word 文档转换为 Excel,以及如何将 PDF 文件转换为 Java 中的 Excel 电子表格。
此处简要讨论以下主题:
用于转换为电子表格的 Java API
GroupDocs.Conversion for Java 是允许您在 Java 应用程序中将 PDF 和 Word 文档转换为电子表格的 API。 API 允许以多种文件格式进行文档和图像转换。一些受支持的文档格式包括文字处理文档、电子表格、演示文稿、电子书、AutoCAD 格式、PDF、电子邮件、网页、图像。
下载并配置
您可以从下载部分获取转换库,或在基于 Maven 的 Java 应用程序中添加以下 pom.xml 配置。之后,您可以尝试本文的示例以及 GitHub 上提供的更多示例。有关详细信息,您可以访问 API 参考。
<repository>
<id>GroupDocsJavaAPI</id>
<name>GroupDocs Java API</name>
<url>http://repository.groupdocs.com/repo/</url>
</repository>
<dependency>
<groupId>com.groupdocs</groupId>
<artifactId>groupdocs-conversion</artifactId>
<version>21.4</version>
</dependency>
在 Java 中将 PDF 转换为 Excel
可以按照以下步骤将任何 PDF 文档转换为 Excel 电子表格。
- 使用 Converter 类加载 PDF 文件。
- 使用 SpreadsheetConvertOptions 准备转换选项。
- 使用创建的选项调用 convert 方法。
以下代码示例展示了如何将 PDF 文件转换为 Java 中的 Excel XLSX 电子表格。
// 在 Java 中将 PDF 文档转换为 Excel 电子表格
Converter converter = new Converter("document.pdf");
SpreadsheetConvertOptions options = new SpreadsheetConvertOptions();
converter.convert("pdfToExcel.xlsx", options);
在 Java 中将 Word 转换为 Excel
同样,任何 Word 文档都可以转换为 Excel 电子表格,方法与我们刚刚转换 PDF 文档的方式相同。提供正确的源文件并将其转换为 XLS 或 XLSX。
以下是将任何 DOC DOCX 文件转换为 Excel 电子表格的步骤。
- 使用 Converter 类加载 DOC、DOCX 文件。
- 使用 SpreadsheetConvertOptions 准备转换选项。
- 使用选项调用Converter 类的convert 方法。
以下源代码显示了如何将 DOC 或 DOCX 文件转换为 Java 中的 Excel XLSX 格式。
// 在 Java 中将 Word 文档转换为 Excel 电子表格
Converter converter = new Converter("document.docx");
SpreadsheetConvertOptions options = new SpreadsheetConvertOptions();
converter.convert("wordToExcel.xlsx", options);
PDF 或 Word 到电子表格的转换,使用 Java 提供更多选项
您不必每次都转换整个文档。您可以只转换文档的选定页面。 API 让您可以使用各种选项转换文档,其中包括:
- 开始页码。
- 页数。
- 特定页面用于转换。
- 格式要转换成。
- 密码 用于使文件受到保护。
- 缩放使其变大或变小。
- 水印在转换器文件上。
以下是如何在 Java 中将 PDF 文件的某些页面转换为具有不同缩放比例的 XLSX 格式的步骤。
// 使用一些选项将 PDF 文件的第二页转换为 Java 中的 Excel
Converter converter = new Converter("document.pdf");
SpreadsheetConvertOptions options = new SpreadsheetConvertOptions();
options.setPageNumber(2);
options.setPagesCount(1);
options.setFormat(SpreadsheetFileType.Xlsx);
options.setZoom(120);
converter.convert("pdfToExcelAdv.xlsx", options);
PDF 文件和转换后的电子表格作为输出显示在此处。它将 PDF 文件的第二页转换为 XLSX 格式。
获取免费 API 许可证
您可以 获得免费的临时许可证 以便在没有评估限制的情况下使用 API。
结论
在本文中,我们讨论了将 PDF 和 Word 文档转换为 Java 中的 Excel 电子表格。此外,我们还学习了如何使用水印、缩放等选项转换文档的任何部分,并使用密码保护对其进行保护。
有关更多选项和示例,请访问 文档 和 GitHub 存储库。如需查询,请通过 论坛 联系我们。