Im heutigen digitalen Zeitalter wird die Möglichkeit, PDF-Dokumente in das HTML-Format zu konvertieren, immer wichtiger. Ob Sie ein Entwickler sind, der an einem Projekt arbeitet, das diese Funktionalität erfordert, oder ein Benutzer, der ein PDF-Dokument zugänglicher machen möchte, es ist wichtig zu verstehen, wie man PDF in HTML in Java konvertiert. In diesem Blogbeitrag führen wir Sie durch den Prozess der Konvertierung von PDF-Dokumenten in HTML mit Java.

Konvertieren Sie PDF in HTML in CSharp.

Java-Entwickler: PDF-zu-HTML-Konvertierungs-API

GroupDocs präsentiert die Dokument- und Bildkonvertierungs-API für Java-Entwickler. Es unterstützt eine große Liste von Dokument- und Bildformaten für die Konvertierung von einem Format in ein anderes. Darüber hinaus können die Konvertierungsergebnisse auch mithilfe der verfügbaren erweiterten Optionen angepasst werden. Ich werde die GroupDocs.Conversion for Java-API verwenden, um ein PDF-Dokument in das HTML-Format zu konvertieren.

Herunterladen oder konfigurieren

Sie können die JAR-Datei aus dem Download-Bereich herunterladen oder einfach die Repository- und Abhängigkeitskonfigurationen für die pom.xml Ihrer Maven-basierten Java-Anwendungen abrufen.

<repository>
	<id>GroupDocsJavaAPI</id>
	<name>GroupDocs Java API</name>
	<url>http://repository.groupdocs.com/repo/</url>
</repository>
<dependency>
        <groupId>com.groupdocs</groupId>
        <artifactId>groupdocs-conversion</artifactId>
        <version>22.12.1</version> 
</dependency>

So konvertieren Sie PDF in HTML mit Java

Das Konvertieren einer PDF-Datei in HTML mit Java ist ein unkomplizierter Vorgang. Die folgenden Schritte führen Sie durch den Vorgang zum Konvertieren aller Seiten einer PDF-Datei in das HTML-Format.

  • Verwenden Sie die Klasse Converter, um die PDF-Datei zu laden.
  • Verwenden Sie die Convert-Methode, um das geladene Dokument in das HTML-Format umzuwandeln.

Der folgende Code zeigt, wie ein ganzes PDF-Dokument mit Java in HTML konvertiert wird.

import com.groupdocs.conversion.Converter;
import com.groupdocs.conversion.options.convert.MarkupConvertOptions;
...

// Konvertieren Sie PDF in HTML in Java
Converter converter = new Converter("path/document.pdf");
converter.convert("path/converted-pdf-to.html", new MarkupConvertOptions());

Konvertieren bestimmter Seiten einer gesicherten PDF-Datei in Java

Auch das Konvertieren geschützter oder gesperrter PDF-Dokumente ist möglich. Die folgenden Schritte führen Sie durch den Prozess der Konvertierung bestimmter Seiten eines gesperrten PDF-Dokuments in das HTML-Format mit Java.

  • Verwenden Sie die Klasse PdfLoadOptions, um die Ladeoptionen vorzubereiten.
  • Laden Sie die PDF-Datei mit der Klasse Converter.
  • Verwenden Sie die Klasse WebConvertOptions, um die Konvertierungsoptionen für das HTML-Format vorzubereiten.
  • Definieren Sie die zu konvertierenden Seiten, indem Sie Eigenschaften wie Pages, PageNumber, PageCount, Zoom usw. festlegen.
  • Verwenden Sie schließlich die Convert-Methode, um die geladene PDF-Datei in das HTML-Format umzuwandeln.

Der folgende Java-Code demonstriert, wie ausgewählte Seiten eines passwortgeschützten PDF-Dokuments in HTML konvertiert werden.

// Konvertieren Sie ausgewählte Seiten passwortgeschützter PDFs in HTML in Java

import com.groupdocs.conversion.Converter;
import com.groupdocs.conversion.options.convert.MarkupConvertOptions;
import com.groupdocs.conversion.options.load.PdfLoadOptions;
...
  
PdfLoadOptions loadOptions = new PdfLoadOptions();
loadOptions.setPassword("pdf-password-12345");
Converter converter = new Converter("path/protected-document.pdf", loadOptions);

MarkupConvertOptions options = new MarkupConvertOptions();
options.setPageNumber(2);
options.setFixedLayout(true);
options.setPagesCount(1);

converter.convert("path/converted-adv-pdf-to-.html", options);

Fazit

Zusammenfassend behandelte dieser Artikel das Thema der Konvertierung von PDF-Dokumenten in HTML in Java. Wir haben zwei verschiedene Ansätze durchlaufen, darunter das Konvertieren des gesamten Dokuments mit Standardoptionen und das Konvertieren bestimmter Seiten eines passwortgeschützten Dokuments.

Weitere Informationen zur Java Conversion Automation API finden Sie in der Dokumentation, API-Referenz oder in den GitHub-Beispielen. Wenn Sie weitere Fragen haben, können Sie sich gerne über das Forum an uns wenden.

Siehe auch