Перетворіть DOCX на HTML у CSharp

Або ви хочете конвертувати документ у формат HTML, щоб отримати вміст для свого веб-сайту, або ви натрапили на веб-сайт для онлайн-подання документів, який вимагає, щоб документи надсилалися у форматі HTML. У будь-якому випадку вам потрібен конвертер DOC у HTML. Однак, якщо вам потрібно програмно перетворити документи на HTML, ця стаття призначена лише для вас. У цій статті розглядатимуться такі способи перетворення документів у HTML у C#:

  • Найпростіше перетворення таких документів, як DOCX, у HTML на C#.
  • Перетворення на HTML із налаштованими параметрами.
  • Перетворюйте за допомогою опції показу або приховування меж сторінки.

Бібліотека перетворення документів C#

GroupDocs.Conversion for .NET — це простий у використанні потужний API із можливістю конвертувати будь-який документ із широкого списку підтримуваних форматів документів у будь-який підтримуваний цільовий формат. Ви можете завантажити API з розділу завантаження або встановити його з NuGet.

Перетворення DOCX на HTML на C# - просто

Це найпростіше і дуже корисне перетворення. Я краще скажу, що ви можете конвертувати будь-який свій документ у формат HTML. Просто перевірте свій формат у списку підтримуваних форматів і переходьте до його конвертації.

  • Створіть екземпляр класу Converter, щоб почати з вашого вихідного документа.
  • Створити об’єкт MarkupConvertOptions.
  • Викличте метод Convert класу Converter.
  • Це воно.

Ваш документ буде перетворено на HTML, а отриманий документ буде у вашому сховищі. У наступному невеликому прикладі коду показано перетворення файлу DOCX у HTML за допомогою класу Converter у C#.

// Converting DOCX to HTML in C#
using (Converter converter = new Converter("document.docx"))
{
    MarkupConvertOptions options = new MarkupConvertOptions();
    converter.Convert("converted.html", options);
}

Перетворіть DOC/DOCX на HTML за допомогою індивідуальних параметрів

GroupDocs.Conversion надає різні інші параметри для отримання бажаного результату перетворення. Налаштовані параметри включають:

  • Фіксований макет
  • Фіксований макет - Show Borders
  • Формат
  • Номер сторінки
  • сторінки
  • сторінки Count
  • Використовуйте PDF
  • Водяний знак
  • Збільшити

Ви можете відвідати документацію або зразки GitHub, щоб детально ознайомитися з кожною опцією. Я покажу деякі з налаштувань, знову перетворюючи формат DOCX на HTML у прикладі коду нижче.

// Converting DOCX to HTML in C# with advance options.
using (Converter converter = new Converter("document.docx"))
{
    MarkupConvertOptions options = new MarkupConvertOptions
    { // Setting customized options
        PageNumber = 2,
        PagesCount = 1,
        FixedLayout = true
    };
    converter.Convert("converted.html", options);
}

Перетворення DOC/DOCX на HTML - Показати або приховати межі сторінки

І останнє, але не менш важливе: тепер ви можете контролювати видимість меж сторінок під час конвертації документів у HTML у C#. GroupDocs.Conversion for .NET надає цей контроль програмістам C#. У наведеному нижче прикладі показано, що встановивши для властивості FixedLayoutShowBorders класу MarkupConvertOptions значення true або false, ви можете відображати або приховувати межі сторінки в отриманому HTML-документі.

// Converting DOCX to HTML in C# with show or hide borders control.
using (Converter converter = new Converter("document.docx"))
{
    MarkupConvertOptions options = new MarkupConvertOptions
    {
        PageNumber = 2,
        FixedLayout = true,
        PagesCount = 1,
        FixedLayoutShowBorders = false
    };
    converter.Convert("converted.html", options);
}

На зображеннях нижче показано оригінальний документ DOCX і перетворений HTML з межами сторінок і без них.

Документ docx для перетворення в HTML

Оригінальний документ DOCX

Файл HTML з межами сторінки та без рамок.

На наведеному вище малюнку показано файли HTML, перетворені з DOCX із параметрами показу меж і без параметрів відображення меж.

Дізнайтеся більше про GroupDocs.Conversion

Давайте поговоримо більше @ Безкоштовний форум підтримки.