У сучасну цифрову епоху можливість конвертувати документи PDF у формат HTML стає все більш важливою. Незалежно від того, чи є ви розробником, який працює над проектом, який потребує цієї функції, чи користувачем, який хоче зробити PDF-документ більш доступним, розуміти, як конвертувати PDF у HTML у Java, важливо. У цій публікації блогу ми розповімо вам про процес перетворення документів PDF у HTML за допомогою Java.
Розробники Java: API перетворення PDF у HTML
GroupDocs демонструє API перетворення документів і зображень для розробників Java. Він підтримує великий список форматів документів і зображень для перетворення з одного формату в інший. Крім того, результати перетворення також можна налаштувати за допомогою доступних розширених параметрів. Я використовуватиму API GroupDocs.Conversion for Java для перетворення документа PDF у формат HTML.
Завантажити або налаштувати
Ви можете завантажити файл JAR із розділу завантажень або просто отримати репозиторій і конфігурації залежностей для pom.xml ваших програм Java на основі Maven.
<repository>
<id>GroupDocsJavaAPI</id>
<name>GroupDocs Java API</name>
<url>http://repository.groupdocs.com/repo/</url>
</repository>
<dependency>
<groupId>com.groupdocs</groupId>
<artifactId>groupdocs-conversion</artifactId>
<version>22.12.1</version>
</dependency>
Як конвертувати PDF у HTML за допомогою Java
Перетворення PDF-файлу на HTML за допомогою Java є простим процесом. Наступні кроки допоможуть вам виконати процес перетворення всіх сторінок файлу PDF у формат HTML.
- Використовуйте клас Converter, щоб завантажити файл PDF.
- Використовуйте метод Convert, щоб перетворити завантажений документ у формат HTML.
Наступний код демонструє, як перетворити цілий PDF-документ у HTML за допомогою Java.
import com.groupdocs.conversion.Converter;
import com.groupdocs.conversion.options.convert.MarkupConvertOptions;
...
// Перетворення PDF на HTML у Java
Converter converter = new Converter("path/document.pdf");
converter.convert("path/converted-pdf-to.html", new MarkupConvertOptions());
Перетворення окремих сторінок захищеного PDF-файлу на Java
Також можливе перетворення захищених або заблокованих PDF-документів. Наступні кроки допоможуть вам виконати процес перетворення окремих сторінок заблокованого документа PDF у формат HTML за допомогою Java.
- Використовуйте клас PdfLoadOptions, щоб підготувати параметри завантаження.
- Завантажте PDF-файл за допомогою класу Конвертер.
- Використовуйте клас WebConvertOptions, щоб підготувати параметри перетворення для формату HTML.
- Визначте конкретні сторінки, які потрібно конвертувати, встановивши такі властивості, як «Сторінки», «Номер сторінки», «Кількість сторінок», «Масштаб» тощо.
- Нарешті, використовуйте метод Convert, щоб перетворити завантажений файл PDF у формат HTML.
Наведений нижче код Java демонструє, як перетворити вибрані сторінки PDF-документа, захищеного паролем, у HTML.
// Перетворюйте вибрані сторінки захищеного паролем PDF-файлу на HTML у Java
import com.groupdocs.conversion.Converter;
import com.groupdocs.conversion.options.convert.MarkupConvertOptions;
import com.groupdocs.conversion.options.load.PdfLoadOptions;
...
PdfLoadOptions loadOptions = new PdfLoadOptions();
loadOptions.setPassword("pdf-password-12345");
Converter converter = new Converter("path/protected-document.pdf", loadOptions);
MarkupConvertOptions options = new MarkupConvertOptions();
options.setPageNumber(2);
options.setFixedLayout(true);
options.setPagesCount(1);
converter.convert("path/converted-adv-pdf-to-.html", options);
Висновок
Підсумовуючи, ця стаття охоплювала тему перетворення PDF-документів у HTML у Java. Ми розглянули два різні підходи, включаючи перетворення всього документа з параметрами за замовчуванням і перетворення окремих сторінок документа, захищеного паролем.
Щоб дізнатися більше про Java Conversion Automation API, зверніться до документації, API Reference або перегляньте приклади GitHub. Якщо у вас є додаткові запитання, зв’яжіться з нами через форум.