V dnešní digitální době je stále důležitější schopnost převádět dokumenty PDF do formátu HTML. Ať už jste vývojář pracující na projektu, který tuto funkci vyžaduje, nebo uživatel, který chce zpřístupnit dokument PDF, je nezbytné pochopit, jak převést PDF do HTML v Java. V tomto příspěvku na blogu vás provedeme procesem převodu dokumentů PDF do HTML pomocí Javy.

Převeďte PDF do HTML v CSharp.

Java Developers: PDF to HTML Conversion API

GroupDocs představuje API pro převod dokumentů a obrázků pro vývojáře v jazyce Java. Podporuje velký seznam formátů dokumentů a obrázků pro převod z jednoho formátu do druhého. Výsledky převodu lze navíc upravit pomocí dostupných pokročilých možností. K převodu dokumentu PDF do formátu HTML použiji jeho GroupDocs.Conversion for Java API.

Stáhnout nebo Konfigurovat

Soubor JAR si můžete stáhnout z části ke stažení, nebo stačí získat konfigurace úložiště a závislostí pro pom.xml vašich Java aplikací založených na maven.

<repository>
	<id>GroupDocsJavaAPI</id>
	<name>GroupDocs Java API</name>
	<url>http://repository.groupdocs.com/repo/</url>
</repository>
<dependency>
        <groupId>com.groupdocs</groupId>
        <artifactId>groupdocs-conversion</artifactId>
        <version>22.12.1</version> 
</dependency>

Jak převést PDF do HTML pomocí Java

Převod PDF do HTML pomocí Java je přímočarý proces. Následující kroky vás provedou procesem převodu všech stránek souboru PDF do formátu HTML.

  • K načtení souboru PDF použijte třídu Converter.
  • Pomocí metody Convert převeďte načtený dokument do formátu HTML.

Následující kód ukazuje, jak převést celý dokument PDF do HTML pomocí Java.

import com.groupdocs.conversion.Converter;
import com.groupdocs.conversion.options.convert.MarkupConvertOptions;
...

// Převod PDF do HTML v Java
Converter converter = new Converter("path/document.pdf");
converter.convert("path/converted-pdf-to.html", new MarkupConvertOptions());

Převod konkrétních stránek zabezpečeného PDF v Java

Převod chráněných nebo zamčených dokumentů PDF je také možný. Následující kroky vás provedou procesem převodu konkrétních stránek zamčeného dokumentu PDF do formátu HTML pomocí Javy.

  • K přípravě možností načítání použijte třídu PdfLoadOptions.
  • Načtěte soubor PDF pomocí třídy Converter.
  • K přípravě možností převodu pro formát HTML použijte třídu WebConvertOptions.
  • Definujte konkrétní stránky, které se mají převést, nastavením vlastností, jako jsou Pages, PageNumber, PageCount, Zoom atd.
  • Nakonec pomocí metody Převést převeďte načtený soubor PDF do formátu HTML.

Následující kód Java ukazuje, jak převést vybrané stránky dokumentu PDF chráněného heslem do HTML.

// Převeďte vybrané stránky PDF chráněných heslem do HTML v Java

import com.groupdocs.conversion.Converter;
import com.groupdocs.conversion.options.convert.MarkupConvertOptions;
import com.groupdocs.conversion.options.load.PdfLoadOptions;
...
  
PdfLoadOptions loadOptions = new PdfLoadOptions();
loadOptions.setPassword("pdf-password-12345");
Converter converter = new Converter("path/protected-document.pdf", loadOptions);

MarkupConvertOptions options = new MarkupConvertOptions();
options.setPageNumber(2);
options.setFixedLayout(true);
options.setPagesCount(1);

converter.convert("path/converted-adv-pdf-to-.html", options);

Závěr

Stručně řečeno, tento článek se zabýval tématem převodu dokumentů PDF do HTML v Java. Prošli jsme dvěma různými přístupy, včetně převodu celého dokumentu s výchozími možnostmi a převodu konkrétních stránek dokumentu chráněného heslem.

Další informace o rozhraní Java Conversion Automation API naleznete v dokumentaci, Referenční příručka rozhraní API nebo se podívejte na příklady GitHubu. Máte-li jakékoli další dotazy, neváhejte nás kontaktovat prostřednictvím fóra.

Viz také