對於 PDF 和 Word 文檔中表格形式的數據,您有時需要將其轉換為 Excel 電子表格。我們需要自動將盡可能多的文檔轉換為電子表格或多個工作簿。本文將討論如何以編程方式將 Word 文檔轉換為 Excel,以及如何使用 Java 將 PDF 文件轉換為 Excel 電子表格。

在 Java 中將 Word 和 PDF 轉換為 Excel

此處簡要討論以下主題:

用於轉換為電子表格的 Java API

GroupDocs.Conversion for Java 是允許您在 Java 應用程序中將 PDF 和 Word 文檔轉換為電子表格的 API。 API 允許多種文件格式的文檔和圖像轉換。一些受支持的文檔格式包括文字處理文檔、電子表格、演示文稿、電子書、AutoCAD 格式、PDF、電子郵件、網頁、圖像。

下載和配置

您可以從下載部分獲取轉換庫,或在基於 Maven 的 Java 應用程序中添加以下 pom.xml 配置。之後,您可以嘗試本文的示例以及 GitHub 上提供的更多示例。有關詳細信息,您可以訪問API 參考

<repository>
	<id>GroupDocsJavaAPI</id>
	<name>GroupDocs Java API</name>
	<url>http://repository.groupdocs.com/repo/</url>
</repository>
<dependency>
        <groupId>com.groupdocs</groupId>
        <artifactId>groupdocs-conversion</artifactId>
        <version>21.4</version> 
</dependency>

在 Java 中將 PDF 轉換為 Excel

可以按照以下步驟將任何 PDF 文檔轉換為 Excel 電子表格。

以下代碼示例顯示瞭如何將 PDF 文件轉換為 Java 中的 Excel XLSX 電子表格。

// 在 Java 中將 PDF 文檔轉換為 Excel 電子表格
Converter converter = new Converter("document.pdf");
SpreadsheetConvertOptions options = new SpreadsheetConvertOptions();
converter.convert("pdfToExcel.xlsx", options);

在 Java 中將 Word 轉換為 Excel

同樣,任何 Word 文檔都可以按照我們剛剛轉換 PDF 文檔的相同方式轉換為 Excel 電子表格。提供正確的源文件並將其轉換為 XLS 或 XLSX。

以下是將任何 DOC DOCX 文件轉換為 Excel 電子表格的步驟。

  • 使用 Converter 類加載 DOC、DOCX 文件。
  • 使用 SpreadsheetConvertOptions 準備轉換選項。
  • 使用選項調用 Converter 類的 convert 方法。

下面的源代碼顯示瞭如何在 Java 中將 DOC 或 DOCX 文件轉換為 Excel XLSX 格式。

// 在 Java 中將 Word 文檔轉換為 Excel 電子表格
Converter converter = new Converter("document.docx");
SpreadsheetConvertOptions options = new SpreadsheetConvertOptions();
converter.convert("wordToExcel.xlsx", options);

PDF 或 Word 到電子表格的轉換,使用 Java 有更多選項

您不必每次都轉換整個文檔。您可以只轉換文檔的選定頁面。 API 賦予您使用各種選項轉換文檔的特權,其中包括:

  • 起始頁碼。
  • 頁數。
  • 用於轉換的特定頁面。
  • 要轉換成的格式。
  • 使文件受到保護的密碼。
  • 縮放以使其變大或變小。
  • 轉換器文件上的水印。

以下是如何在 Java 中將 PDF 文件的部分頁面轉換為具有不同縮放比例的 XLSX 格式的步驟。

// 使用一些選項將 PDF 文件的第二頁轉換為 Java 中的 Excel
Converter converter = new Converter("document.pdf");
SpreadsheetConvertOptions options = new SpreadsheetConvertOptions();
options.setPageNumber(2);
options.setPagesCount(1);
options.setFormat(SpreadsheetFileType.Xlsx);
options.setZoom(120);

converter.convert("pdfToExcelAdv.xlsx", options);

PDF 文件和轉換後的電子表格作為輸出顯示在此處。它將 PDF 文件的第二頁轉換為 XLSX 格式。

以編程方式將 PDF 轉換為 Excel XLS XLSX

獲取免費的 API 許可證

您可以獲得免費的臨時許可證,以便在不受評估限制的情況下使用 API。

結論

在本文中,我們討論了用 Java 將 PDF 和 Word 文檔轉換為 Excel 電子表格。此外,我們還學習瞭如何使用水印、縮放等選項轉換文檔的任何部分,並使用密碼保護對其進行保護。

有關更多選項和示例,請訪問 文檔GitHub 存儲庫。如有疑問,請通過 論壇 聯繫我們。

也可以看看