A minificação de HTML melhora o desempenho do aplicativo da Web com tempo de carregamento eficiente e uso de largura de banda. Partes desnecessárias de código, espaços em branco insignificantes, comentários, ponto e vírgula, valores de cores no HTML e CSS são otimizados no processo de minificação. Vamos automatizar o processo para se livrar do código indesejado e melhorar a eficiência em seus aplicativos Java. Para melhorar o desempenho, este artigo discute como renderizar documentos do Word para HTML reduzido em Java.

Renderizar documentos do Word como um HTML limpo em Java

API Java para renderizar como HTML minificado

GroupDocs.Viewer apresenta uma API de visualização de documentos que permite renderizar vários tipos de documentos em HTML, PDF e formatos de imagem em aplicativos Java. Usarei essa API no exemplo para converter o arquivo DOCX do Microsoft Word em um arquivo HTML limpo.

Você pode baixar o arquivo JAR da seção de downloads ou usar o repositório e a dependência mais recente [Maven](https://repository.groupdocs. com/webapp/#/artifacts/browse/tree/General/repo/com/groupdocs) em seus aplicativos Java.

<repository>
	<id>GroupDocsArtifactRepository</id>
	<name>GroupDocs Artifact Repository</name>
	<url>https://repository.groupdocs.com/repo/</url>
</repository>

<dependency>
        <groupId>com.groupdocs</groupId>
        <artifactId>groupdocs-viewer</artifactId>
        <version>21.11.1</version> 
</dependency>

Renderizar Word DOC/DOCX para HTML Minificado em Java

Os arquivos HTML podem ser gerados com recursos incorporados ou externos usando os respectivos métodos. As etapas a seguir mostram como renderizar o documento do Word (DOC/DOCX) em HTML reduzido em Java.

  • Carregue o arquivo DOCX usando a classe Viewer.
  • Prepare as opções de renderização HTML usando a classe HtmlViewOptions.
  • Habilite a opção de minificação configurando-a como verdadeira.
  • Use view() com as opções criadas para renderizar o arquivo DOCX como HTML reduzido.

O exemplo de código Java a seguir renderiza o arquivo Word DOCX em HTML reduzido.

// Converter Word DOC/DOCX para HTML Minificado em Java
Viewer viewer = new Viewer("path/document.docx");

HtmlViewOptions viewOptions = HtmlViewOptions.forEmbeddedResources("path/page_{0}.html");
viewOptions.setMinify(true);

viewer.view(viewOptions);

Obtenha uma licença de API gratuita

Você pode usar as APIs gratuitamente sem limitações de avaliação obtendo uma licença temporária.

Conclusão

Para concluir, este artigo discutiu como renderizar os arquivos DOC/DOCX como HTML minificado em Java. Você pode desenvolver seu próprio conversor de documentos online e minificador de HTML que permite aos usuários converter os documentos em HTML reduzido. Além disso, você pode aprender mais sobre o GroupDocs.Viewer for Java em sua documentação. Para dúvidas, entre em contato conosco pelo fórum.

Veja também