在當今的數字時代,將 PDF 文檔轉換為 HTML 格式的能力變得越來越重要。無論您是從事需要此功能的項目的開發人員,還是希望使 PDF 文檔更易於訪問的用戶,了解如何在 Java 中將 PDF 轉換為 HTML 都是必不可少的。在這篇博文中,我們將引導您完成使用 Java 將 PDF 文檔轉換為 HTML 的過程。

在 CSharp 中將 PDF 轉換為 HTML。

Java 開發人員:PDF 到 HTML 轉換 API

GroupDocs 為 Java 開發人員展示了文檔和圖像轉換 API。它支持從一種格式轉換為另一種格式的大量文檔和圖像格式。此外,還可以使用可用的高級選項自定義轉換結果。我將使用其 GroupDocs.Conversion for Java API 將 PDF 文檔轉換為 HTML 格式。

下載或配置

您可以從 下載部分 下載 JAR 文件,或者只獲取基於 maven 的 Java 應用程序的 pom.xml 的存儲庫和依賴項配置。

<repository>
	<id>GroupDocsJavaAPI</id>
	<name>GroupDocs Java API</name>
	<url>http://repository.groupdocs.com/repo/</url>
</repository>
<dependency>
        <groupId>com.groupdocs</groupId>
        <artifactId>groupdocs-conversion</artifactId>
        <version>22.12.1</version> 
</dependency>

如何使用 Java 將 PDF 轉換為 HTML

使用 Java 將 PDF 轉換為 HTML 是一個簡單的過程。以下步驟將指導您完成將 PDF 文件的所有頁面轉換為 HTML 格式的過程。

  • 使用 Converter 類加載 PDF 文件。
  • 使用 Convert 方法將加載的文檔轉換為 HTML 格式。

以下代碼演示瞭如何使用 Java 將整個 PDF 文檔轉換為 HTML。

import com.groupdocs.conversion.Converter;
import com.groupdocs.conversion.options.convert.MarkupConvertOptions;
...

// 在 Java 中將 PDF 轉換為 HTML
Converter converter = new Converter("path/document.pdf");
converter.convert("path/converted-pdf-to.html", new MarkupConvertOptions());

在 Java 中轉換受保護的 PDF 的特定頁面

也可以轉換受保護或鎖定的 PDF 文檔。以下步驟將指導您完成使用 Java 將鎖定的 PDF 文檔的特定頁面轉換為 HTML 格式的過程。

  • 使用 PdfLoadOptions 類準備加載選項。
  • 使用 Converter 類加載 PDF 文件。
  • 使用 WebConvertOptions 類為 HTML 格式準備轉換選項。
  • 通過設置 Pages、PageNumber、PageCount、Zoom 等屬性來定義要轉換的特定頁面。
  • 最後,使用 Convert 方法將加載的 PDF 文件轉換為 HTML 格式。

以下 Java 代碼演示瞭如何將受密碼保護的 PDF 文檔的選定頁面轉換為 HTML。

// 在 Java 中將受密碼保護的 PDF 的選定頁面轉換為 HTML

import com.groupdocs.conversion.Converter;
import com.groupdocs.conversion.options.convert.MarkupConvertOptions;
import com.groupdocs.conversion.options.load.PdfLoadOptions;
...
  
PdfLoadOptions loadOptions = new PdfLoadOptions();
loadOptions.setPassword("pdf-password-12345");
Converter converter = new Converter("path/protected-document.pdf", loadOptions);

MarkupConvertOptions options = new MarkupConvertOptions();
options.setPageNumber(2);
options.setFixedLayout(true);
options.setPagesCount(1);

converter.convert("path/converted-adv-pdf-to-.html", options);

結論

總之,本文涵蓋了用 Java 將 PDF 文檔轉換為 HTML 的主題。我們介紹了兩種不同的方法,包括使用默認選項轉換整個文檔和轉換受密碼保護文檔的特定頁面。

要了解有關 Java Conversion Automation API 的更多信息,請參閱 文檔API 參考,或查看 GitHub 示例。如果您有任何其他問題,請隨時通過 論壇 與我們聯繫。

也可以看看