La limpieza y minificación de HTML mejora el tiempo de carga y el uso de ancho de banda de las páginas web. Se observa que se inyecta código innecesario cuando un documento se convierte a formato HTML usando algunas herramientas. Puede deshacerse de este código no deseado dentro de sus aplicaciones .NET. Este artículo analiza cómo representar documentos de Word en HTML minimizado usando C#.

Renderizar Word como HTML limpio usando C#

.NET API para renderizar como HTML minimizado

GroupDocs.Viewer proporciona una API de visualización de documentos que permite convertir varios documentos en HTML, PDF y formatos de imagen dentro de la aplicación .NET. Usaré esta API en los ejemplos para convertir el archivo DOCX en un archivo HTML limpio.

Puede descargar las DLL o el instalador MSI desde la sección de descargas o instalar la API en su aplicación .NET a través de [NuGet](https://www.nuget .org/packages/groupdocs.viewer).

PM> Install-Package GroupDocs.Viewer

Renderizar Word DOC/DOCX a HTML Minificado usando C#

Los archivos HTML se pueden obtener con recursos incrustados o externos utilizando los métodos respectivos. Los siguientes pasos muestran cómo convertir el documento de Word (DOC/DOCX) en HTML minimizado usando C#.

  • Cargue el archivo DOCX usando la clase Viewer.
  • Prepare las opciones de representación de HTML mediante la clase HtmlViewOptions.
  • Habilite la opción Minimizar configurándola en verdadero.
  • Utilice View() con las opciones creadas para representar el archivo DOCX como HTML minimizado.

El siguiente ejemplo de código C# representa el archivo DOCX de Word en HTML minimizado.

// Convierta Word DOC/DOCX a HTML minimizado usando C#
using (Viewer viewer = new Viewer("path/document.docx"))
{
    HtmlViewOptions options = HtmlViewOptions.ForEmbeddedResources("path/page_{0}.html");
    options.Minify = true;

    viewer.View(options);
}

Obtenga una licencia de API gratuita

Puede usar las API de forma gratuita sin limitaciones de evaluación obteniendo una licencia temporal.

Conclusión

Para resumir, discutimos cómo representar los archivos DOC/DOCX como HTML minimizado usando C#. Puede crear su propio convertidor y limpiador en línea que permita a los usuarios convertir los documentos a HTML minimizado. Además, puede obtener más información sobre GroupDocs.Viewer para .NET en su documentación . Para consultas, contáctenos a través del foro.

Ver también