Очистка и минимизация HTML уменьшают время загрузки и использование пропускной способности веб-страниц. Замечено, что при преобразовании одного документа в формат HTML с помощью некоторых инструментов вводится некоторый ненужный код. Вы можете избавиться от этого нежелательного кода в своих приложениях .NET. В этой статье обсуждается, как преобразовывать документы Word в минимизированный HTML с помощью C#.

Визуализировать Word как чистый HTML с помощью C#

.NET API для рендеринга в виде минимизированного HTML

GroupDocs.Viewer предоставляет API для просмотра документов, который позволяет отображать различные документы в формате HTML, PDF и форматы изображений в приложении .NET. Я буду использовать этот API в примерах для преобразования файла DOCX в чистый файл HTML.

Вы можете загрузить библиотеки DLL или установщик MSI из раздела загрузок или установить API в своем приложении .NET через [NuGet](https://www.nuget .org/packages/groupdocs.viewer).

PM> Install-Package GroupDocs.Viewer

Рендеринг Word DOC/DOCX в минимизированный HTML с использованием C#

HTML-файлы могут быть получены как встроенными, так и внешними ресурсами с использованием соответствующих методов. Следующие шаги показывают, как преобразовать документ Word (DOC/DOCX) в минимизированный HTML с помощью C#.

  • Загрузите файл DOCX с помощью класса Viewer.
  • Подготовьте параметры рендеринга HTML с помощью класса HtmlViewOptions.
  • Включите параметр Minify, установив для него значение true.
  • Используйте View() с созданными параметрами для отображения файла DOCX в виде уменьшенного HTML.

В следующем примере кода C# файл Word DOCX преобразуется в уменьшенный HTML.

// Преобразование Word DOC/DOCX в уменьшенный HTML с помощью C#
using (Viewer viewer = new Viewer("path/document.docx"))
{
    HtmlViewOptions options = HtmlViewOptions.ForEmbeddedResources("path/page_{0}.html");
    options.Minify = true;

    viewer.View(options);
}

Получите бесплатную лицензию API

Вы можете использовать API бесплатно без ограничений на пробную версию, получив временную лицензию.

Вывод

Подводя итог, мы обсудили, как визуализировать файлы DOC/DOCX в виде минимизированного HTML с помощью C#. Вы можете создать свой собственный онлайн-конвертер и очиститель, который позволит пользователям преобразовывать документы в минимизированный HTML. Кроме того, вы можете узнать больше о GroupDocs.Viewer для .NET из его документации . По вопросам обращайтесь к нам через форум.

Смотрите также