Le nettoyage et la minification du HTML améliorent le temps de chargement et l’utilisation de la bande passante des pages Web. On observe que du code inutile est injecté lorsqu’un document est converti au format HTML à l’aide de certains outils. Vous pouvez vous débarrasser de ce code indésirable dans vos applications .NET. Cet article explique comment rendre des documents Word en HTML minifié à l’aide de C#.

Rendre Word en HTML propre à l'aide de C#

API .NET pour le rendu en HTML minifié

GroupDocs.Viewer fournit une API de visualisation de documents qui permet de rendre divers documents en HTML, PDF et formats d’image dans l’application .NET. J’utiliserai cette API dans les exemples pour convertir le fichier DOCX en un fichier HTML propre.

Vous pouvez télécharger les DLL ou le programme d’installation MSI à partir de la section des téléchargements ou installer l’API dans votre application .NET via [NuGet](https://www.nuget .org/packages/groupdocs.viewer).

PM> Install-Package GroupDocs.Viewer

Rendre Word DOC/DOCX en HTML minifié à l’aide de C#

Les fichiers HTML peuvent être obtenus avec des ressources intégrées ou externes en utilisant les méthodes respectives. Les étapes suivantes montrent comment convertir le document Word (DOC/DOCX) en HTML minifié à l’aide de C#.

  • Chargez le fichier DOCX à l’aide de la classe Viewer.
  • Préparez les options de rendu HTML à l’aide de la classe HtmlViewOptions.
  • Activez l’option Minify en la définissant sur true.
  • Utilisez View() avec les options créées pour rendre le fichier DOCX en HTML minifié.

L’exemple de code C# suivant restitue le fichier Word DOCX en HTML minifié.

// Convertir Word DOC/DOCX en HTML minifié à l'aide de C#
using (Viewer viewer = new Viewer("path/document.docx"))
{
    HtmlViewOptions options = HtmlViewOptions.ForEmbeddedResources("path/page_{0}.html");
    options.Minify = true;

    viewer.View(options);
}

Obtenez une licence API gratuite

Vous pouvez utiliser les API gratuitement sans limitation d’évaluation en obtenant une licence temporaire.

Conclusion

Pour résumer, nous avons discuté de la façon de rendre les fichiers DOC/DOCX en HTML minifié à l’aide de C#. Vous pouvez créer votre propre convertisseur et nettoyeur en ligne qui permet aux utilisateurs de convertir les documents en HTML minifié. En outre, vous pouvez en savoir plus sur GroupDocs.Viewer pour .NET à partir de sa documentation . Pour toute question, contactez-nous via le forum.

Voir également