Минимизация HTML повышает производительность веб-приложений за счет эффективного использования времени загрузки и полосы пропускания. Ненужные части кода, незначительные пробелы, комментарии, точки с запятой, значения цветов в HTML и CSS оптимизируются в процессе минификации. Давайте автоматизируем процесс, чтобы избавиться от нежелательного кода и повысить эффективность ваших Java-приложений. Чтобы повысить производительность, в этой статье обсуждается, как преобразовывать документы Word в минимизированный HTML в Java.

Рендеринг документов Word как чистого HTML в Java

Java API для рендеринга в виде минимизированного HTML

GroupDocs.Viewer демонстрирует API просмотра документов, который позволяет отображать различные типы документов в HTML, PDF и форматы изображений в приложениях Java. Я буду использовать этот API в примере для преобразования файла Microsoft Word DOCX в чистый HTML-файл.

Вы можете загрузить файл JAR из раздела загрузок или использовать последний репозиторий и зависимость [Maven](https://repository.groupdocs. com/webapp/#/artifacts/browse/tree/General/repo/com/groupdocs) в ваших приложениях Java.

<repository>
	<id>GroupDocsArtifactRepository</id>
	<name>GroupDocs Artifact Repository</name>
	<url>https://repository.groupdocs.com/repo/</url>
</repository>

<dependency>
        <groupId>com.groupdocs</groupId>
        <artifactId>groupdocs-viewer</artifactId>
        <version>21.11.1</version> 
</dependency>

Рендеринг Word DOC/DOCX в минимизированный HTML на Java

Файлы HTML могут быть созданы как со встроенными, так и с внешними ресурсами с использованием соответствующих методов. Следующие шаги показывают, как преобразовать документ Word (DOC/DOCX) в минимизированный HTML в Java.

  • Загрузите файл DOCX с помощью класса Viewer.
  • Подготовьте параметры рендеринга HTML с помощью класса HtmlViewOptions.
  • Включите параметр минимизации, установив для него значение true.
  • Используйте view() с созданными параметрами, чтобы отобразить файл DOCX в виде уменьшенного HTML.

В следующем примере кода Java файл Word DOCX преобразуется в уменьшенный HTML.

// Преобразование Word DOC/DOCX в минимизированный HTML в Java
Viewer viewer = new Viewer("path/document.docx");

HtmlViewOptions viewOptions = HtmlViewOptions.forEmbeddedResources("path/page_{0}.html");
viewOptions.setMinify(true);

viewer.view(viewOptions);

Получите бесплатную лицензию API

Вы можете использовать API бесплатно без ограничений на пробную версию, получив временную лицензию.

Вывод

В заключение, в этой статье обсуждалось, как отображать файлы DOC/DOCX в виде минимизированного HTML в Java. Вы можете разработать собственный онлайн-конвертер документов и минимизатор HTML, которые позволят пользователям преобразовывать документы в минимизированный HTML. Кроме того, вы можете узнать больше о GroupDocs.Viewer для Java из его документации. По вопросам обращайтесь к нам через форум.

Смотрите также