У сучасну цифрову епоху можливість конвертувати документи PDF у формат HTML стає все більш важливою. Незалежно від того, чи є ви розробником, який працює над проектом, який потребує цієї функції, чи користувачем, який хоче зробити PDF-документ більш доступним, розуміти, як конвертувати PDF у HTML у Java, важливо. У цій публікації блогу ми розповімо вам про процес перетворення документів PDF у HTML за допомогою Java.

Конвертуйте PDF у HTML у CSharp.

Розробники Java: API перетворення PDF у HTML

GroupDocs демонструє API перетворення документів і зображень для розробників Java. Він підтримує великий список форматів документів і зображень для перетворення з одного формату в інший. Крім того, результати перетворення також можна налаштувати за допомогою доступних розширених параметрів. Я використовуватиму API GroupDocs.Conversion for Java для перетворення документа PDF у формат HTML.

Завантажити або налаштувати

Ви можете завантажити файл JAR із розділу завантажень або просто отримати репозиторій і конфігурації залежностей для pom.xml ваших програм Java на основі Maven.

<repository>
	<id>GroupDocsJavaAPI</id>
	<name>GroupDocs Java API</name>
	<url>http://repository.groupdocs.com/repo/</url>
</repository>
<dependency>
        <groupId>com.groupdocs</groupId>
        <artifactId>groupdocs-conversion</artifactId>
        <version>22.12.1</version> 
</dependency>

Як конвертувати PDF у HTML за допомогою Java

Перетворення PDF-файлу на HTML за допомогою Java є простим процесом. Наступні кроки допоможуть вам виконати процес перетворення всіх сторінок файлу PDF у формат HTML.

  • Використовуйте клас Converter, щоб завантажити файл PDF.
  • Використовуйте метод Convert, щоб перетворити завантажений документ у формат HTML.

Наступний код демонструє, як перетворити цілий PDF-документ у HTML за допомогою Java.

import com.groupdocs.conversion.Converter;
import com.groupdocs.conversion.options.convert.MarkupConvertOptions;
...

// Перетворення PDF на HTML у Java
Converter converter = new Converter("path/document.pdf");
converter.convert("path/converted-pdf-to.html", new MarkupConvertOptions());

Перетворення окремих сторінок захищеного PDF-файлу на Java

Також можливе перетворення захищених або заблокованих PDF-документів. Наступні кроки допоможуть вам виконати процес перетворення окремих сторінок заблокованого документа PDF у формат HTML за допомогою Java.

  • Використовуйте клас PdfLoadOptions, щоб підготувати параметри завантаження.
  • Завантажте PDF-файл за допомогою класу Конвертер.
  • Використовуйте клас WebConvertOptions, щоб підготувати параметри перетворення для формату HTML.
  • Визначте конкретні сторінки, які потрібно конвертувати, встановивши такі властивості, як «Сторінки», «Номер сторінки», «Кількість сторінок», «Масштаб» тощо.
  • Нарешті, використовуйте метод Convert, щоб перетворити завантажений файл PDF у формат HTML.

Наведений нижче код Java демонструє, як перетворити вибрані сторінки PDF-документа, захищеного паролем, у HTML.

// Перетворюйте вибрані сторінки захищеного паролем PDF-файлу на HTML у Java

import com.groupdocs.conversion.Converter;
import com.groupdocs.conversion.options.convert.MarkupConvertOptions;
import com.groupdocs.conversion.options.load.PdfLoadOptions;
...
  
PdfLoadOptions loadOptions = new PdfLoadOptions();
loadOptions.setPassword("pdf-password-12345");
Converter converter = new Converter("path/protected-document.pdf", loadOptions);

MarkupConvertOptions options = new MarkupConvertOptions();
options.setPageNumber(2);
options.setFixedLayout(true);
options.setPagesCount(1);

converter.convert("path/converted-adv-pdf-to-.html", options);

Висновок

Підсумовуючи, ця стаття охоплювала тему перетворення PDF-документів у HTML у Java. Ми розглянули два різні підходи, включаючи перетворення всього документа з параметрами за замовчуванням і перетворення окремих сторінок документа, захищеного паролем.

Щоб дізнатися більше про Java Conversion Automation API, зверніться до документації, API Reference або перегляньте приклади GitHub. Якщо у вас є додаткові запитання, зв’яжіться з нами через форум.

Дивись також