La minificación de HTML mejora el rendimiento de la aplicación web con un tiempo de carga y un uso de ancho de banda eficientes. Las partes innecesarias del código, los espacios en blanco insignificantes, los comentarios, los puntos y comas, los valores de color en HTML y CSS se optimizan en el proceso de minificación. Automaticemos el proceso para deshacernos del código no deseado y mejorar la eficiencia dentro de sus aplicaciones Java. Para mejorar el rendimiento, este artículo analiza cómo convertir documentos de Word en HTML minimizado en Java.

Renderizar documentos de Word como un HTML limpio en Java

API de Java para renderizar como HTML minimizado

GroupDocs.Viewer muestra una API de visualización de documentos que permite representar varios tipos de documentos en HTML, PDF y formatos de imagen dentro de aplicaciones Java. Usaré esta API en el ejemplo para convertir el archivo DOCX de Microsoft Word en un archivo HTML limpio.

Puede descargar el archivo JAR desde la sección de descargas o usar las últimas configuraciones de repositorio y dependencia Maven dentro de sus aplicaciones Java.

<repository>
	<id>GroupDocsArtifactRepository</id>
	<name>GroupDocs Artifact Repository</name>
	<url>https://repository.groupdocs.com/repo/</url>
</repository>

<dependency>
        <groupId>com.groupdocs</groupId>
        <artifactId>groupdocs-viewer</artifactId>
        <version>21.11.1</version> 
</dependency>

Renderizar Word DOC/DOCX a HTML minificado en Java

Los archivos HTML se pueden generar con recursos incrustados o externos utilizando los métodos respectivos. Los siguientes pasos muestran cómo convertir el documento de Word (DOC/DOCX) en HTML minificado en Java.

  • Cargue el archivo DOCX usando la clase Viewer.
  • Prepare las opciones de representación de HTML mediante la clase HtmlViewOptions.
  • Habilite la opción de minificación configurándola en verdadero.
  • Utilice la vista() con las opciones creadas para representar el archivo DOCX como HTML minimizado.

El siguiente ejemplo de código Java representa el archivo DOCX de Word en HTML minimizado.

// Convierta Word DOC/DOCX a HTML minificado en Java
Viewer viewer = new Viewer("path/document.docx");

HtmlViewOptions viewOptions = HtmlViewOptions.forEmbeddedResources("path/page_{0}.html");
viewOptions.setMinify(true);

viewer.view(viewOptions);

Obtenga una licencia de API gratuita

Puede usar las API de forma gratuita sin limitaciones de evaluación obteniendo una licencia temporal.

Conclusión

Para concluir, este artículo trata sobre cómo representar los archivos DOC/DOCX como HTML minificado en Java. Puede desarrollar su propio convertidor de documentos en línea y minimizador de HTML que permita a los usuarios convertir los documentos a HTML minimizado. Además, puede obtener más información sobre GroupDocs.Viewer for Java en su documentación. Para consultas, contáctenos a través del foro.

Ver también