В сегодняшнюю цифровую эпоху возможность конвертировать PDF-документы в формат HTML становится все более важной. Независимо от того, являетесь ли вы разработчиком, работающим над проектом, для которого требуется эта функциональность, или пользователем, который хочет сделать PDF-документ более доступным, понимание того, как конвертировать PDF в HTML на Java, имеет важное значение. В этом сообщении блога мы познакомим вас с процессом преобразования PDF-документов в HTML с помощью Java.

Преобразование PDF в HTML в CSharp.

Java-разработчики: API преобразования PDF в HTML

GroupDocs демонстрирует API преобразования документов и изображений для разработчиков Java. Он поддерживает большой список форматов документов и изображений для преобразования из одного формата в другой. Кроме того, результаты преобразования также можно настроить с помощью доступных дополнительных параметров. Я буду использовать его GroupDocs.Conversion for Java API для преобразования документа PDF в формат HTML.

Скачать или настроить

Вы можете загрузить JAR-файл из раздела загрузок или просто получить репозиторий и конфигурации зависимостей для pom.xml ваших Java-приложений на основе maven.

<repository>
	<id>GroupDocsJavaAPI</id>
	<name>GroupDocs Java API</name>
	<url>http://repository.groupdocs.com/repo/</url>
</repository>
<dependency>
        <groupId>com.groupdocs</groupId>
        <artifactId>groupdocs-conversion</artifactId>
        <version>22.12.1</version> 
</dependency>

Как конвертировать PDF в HTML с помощью Java

Преобразование PDF в HTML с помощью Java — простой процесс. Следующие шаги проведут вас через процесс преобразования всех страниц файла PDF в формат HTML.

  • Используйте класс Converter для загрузки файла PDF.
  • Используйте метод Convert для преобразования загруженного документа в формат HTML.

Следующий код демонстрирует, как преобразовать весь PDF-документ в HTML с помощью Java.

import com.groupdocs.conversion.Converter;
import com.groupdocs.conversion.options.convert.MarkupConvertOptions;
...

// Преобразование PDF в HTML на Java
Converter converter = new Converter("path/document.pdf");
converter.convert("path/converted-pdf-to.html", new MarkupConvertOptions());

Преобразование определенных страниц защищенного PDF-файла в Java

Преобразование защищенных или заблокированных PDF-документов также возможно. Следующие шаги проведут вас через процесс преобразования определенных страниц заблокированного документа PDF в формат HTML с помощью Java.

  • Используйте класс PdfLoadOptions для подготовки параметров загрузки.
  • Загрузите файл PDF с помощью класса Converter.
  • Используйте класс WebConvertOptions, чтобы подготовить параметры преобразования для формата HTML.
  • Определите конкретные страницы для преобразования, установив такие свойства, как Pages, PageNumber, PageCount, Zoom и т. д.
  • Наконец, используйте метод Convert для преобразования загруженного файла PDF в формат HTML.

Следующий код Java демонстрирует, как преобразовать выбранные страницы PDF-документа, защищенного паролем, в HTML.

// Преобразование выбранных страниц защищенного паролем PDF в HTML на Java

import com.groupdocs.conversion.Converter;
import com.groupdocs.conversion.options.convert.MarkupConvertOptions;
import com.groupdocs.conversion.options.load.PdfLoadOptions;
...
  
PdfLoadOptions loadOptions = new PdfLoadOptions();
loadOptions.setPassword("pdf-password-12345");
Converter converter = new Converter("path/protected-document.pdf", loadOptions);

MarkupConvertOptions options = new MarkupConvertOptions();
options.setPageNumber(2);
options.setFixedLayout(true);
options.setPagesCount(1);

converter.convert("path/converted-adv-pdf-to-.html", options);

Заключение

Таким образом, в этой статье была рассмотрена тема преобразования PDF-документов в HTML на Java. Мы рассмотрели два разных подхода, включая преобразование всего документа с параметрами по умолчанию и преобразование определенных страниц документа, защищенного паролем.

Чтобы узнать больше об API автоматизации преобразования Java, обратитесь к документации, справке по API или ознакомьтесь с примерами GitHub. Если у вас есть дополнительные вопросы, обращайтесь к нам через форум.

Смотрите также