今日のデジタル時代では、PDF ドキュメントを HTML 形式に変換する機能がますます重要になっています。この機能を必要とするプロジェクトに取り組んでいる開発者であろうと、PDF ドキュメントのアクセシビリティを高めようとしているユーザーであろうと、Java で PDF を HTML に変換する方法を理解することは不可欠です。このブログ投稿では、Java を使用して PDF ドキュメントを HTML に変換するプロセスについて説明します。

CSharp で PDF を HTML に変換します。

Java 開発者: PDF から HTML への変換 API

GroupDocs は、Java 開発者向けのドキュメントと画像の変換 API を紹介しています。ある形式から別の形式に変換するためのドキュメントおよび画像形式の多数のリストをサポートしています。さらに、利用可能な高度なオプションを使用して、変換結果をカスタマイズすることもできます。その GroupDocs.Conversion for Java API を使用して、PDF ドキュメントを HTML 形式に変換します。

ダウンロードまたは構成

ダウンロード セクション から JAR ファイルをダウンロードするか、Maven ベースの Java アプリケーションの pom.xml のリポジトリと依存関係の構成を取得します。

<repository>
	<id>GroupDocsJavaAPI</id>
	<name>GroupDocs Java API</name>
	<url>http://repository.groupdocs.com/repo/</url>
</repository>
<dependency>
        <groupId>com.groupdocs</groupId>
        <artifactId>groupdocs-conversion</artifactId>
        <version>22.12.1</version> 
</dependency>

Java を使用して PDF を HTML に変換する方法

Java を使用して PDF を HTML に変換するのは簡単なプロセスです。次の手順では、PDF ファイルのすべてのページを HTML 形式に変換するプロセスについて説明します。

  • Converter クラスを使用して PDF ファイルを読み込みます。
  • Convert メソッドを使用して、読み込まれたドキュメントを HTML 形式に変換します。

次のコードは、Java を使用して PDF ドキュメント全体を HTML に変換する方法を示しています。

import com.groupdocs.conversion.Converter;
import com.groupdocs.conversion.options.convert.MarkupConvertOptions;
...

// PDF を Java で HTML に変換する
Converter converter = new Converter("path/document.pdf");
converter.convert("path/converted-pdf-to.html", new MarkupConvertOptions());

Java で保護された PDF の特定のページを変換する

保護またはロックされた PDF ドキュメントの変換も可能です。次の手順では、ロックされた PDF ドキュメントの特定のページを Java を使用して HTML 形式に変換するプロセスについて説明します。

  • PdfLoadOptions クラスを使用して、読み込みオプションを準備します。
  • Converter クラスを使用して PDF ファイルを読み込みます。
  • WebConvertOptions クラスを利用して、HTML 形式の変換オプションを用意します。
  • Pages、PageNumber、PageCount、Zoom などのプロパティを設定して、変換する特定のページを定義します。
  • 最後に、Convert メソッドを使用して、読み込んだ PDF ファイルを HTML 形式に変換します。

次の Java コードは、パスワードで保護された PDF ドキュメントの選択したページを HTML に変換する方法を示しています。

// パスワードで保護された PDF の選択したページを Java で HTML に変換する

import com.groupdocs.conversion.Converter;
import com.groupdocs.conversion.options.convert.MarkupConvertOptions;
import com.groupdocs.conversion.options.load.PdfLoadOptions;
...
  
PdfLoadOptions loadOptions = new PdfLoadOptions();
loadOptions.setPassword("pdf-password-12345");
Converter converter = new Converter("path/protected-document.pdf", loadOptions);

MarkupConvertOptions options = new MarkupConvertOptions();
options.setPageNumber(2);
options.setFixedLayout(true);
options.setPagesCount(1);

converter.convert("path/converted-adv-pdf-to-.html", options);

結論

要約すると、この記事では Java で PDF 文書を HTML に変換するトピックについて説明しました。既定のオプションを使用してドキュメント全体を変換する方法と、パスワードで保護されたドキュメントの特定のページを変換する方法など、2 つの異なる方法を説明しました。

Java Conversion Automation API の詳細については、ドキュメントAPI リファレンス、または GitHub の例 を参照してください。他にご不明な点がございましたら、フォーラム からお気軽にお問い合わせください。

関連項目