Текстовые документы присутствуют почти на каждом устройстве в этом цифровом мире. Точно так же почти каждый текстовый редактор начал поддерживать формат уценки. Непрерывное увеличение файлов MD по мере того, как веб-страницы увеличивают преобразование содержимого Word в веб-сайты с использованием формата уценки. В этой статье обсуждается, как программно преобразовать документы Word в файлы уценки с помощью C#.

Преобразование документа Word в Markdown в C#

.NET API для анализа и преобразования файлов Markdown

GroupDocs демонстрирует свой .NET API, который позволяет анализировать и преобразовывать документы Word в другие форматы в приложениях .NET. Мы будем использовать его GroupDocs.Parser for .NET для разбора и преобразования файлов Word DOC/DOCX в файлы MD. Кроме того, API поддерживает синтаксический анализ многих других форматов файлов, таких как PDF-файлы, электронные таблицы, презентации, электронные книги, документы с разметкой, форматы электронной почты, архивы, изображения и многие другие, упомянутые в документации.

Вы можете загрузить библиотеки DLL или установщик MSI из раздела загрузок или установить API в своем приложении .NET через NuGet.

PM> Install-Package GroupDocs.Parser

Как преобразовать Word в Markdown с помощью C#

Давайте быстро перейдем к цели и преобразуем документ Microsoft Word в формат уценки. Следующие шаги показывают, как преобразовать Word DOC/DOCX в Markdown с помощью C#.

  • Загрузите файл MS Word, используя класс Parser.
  • Получите форматированный текст загруженного файла, используя класс FormattedTextOptions и режим Markdown.
  • Прочтите все содержимое с помощью метода ReadToEnd.
  • Преобразуйте его в Markdown, записав содержимое в файл MD с помощью метода Write класса TextWriter.

Следующий исходный код C# преобразует файл docx MS Word в формат Markdown.

using System.IO;
using GroupDocs.Parser.Options;
...
...
using (Parser parser = new Parser("/path/document.docx"))
{
    using (TextReader reader = parser.GetFormattedText(new FormattedTextOptions(FormattedTextMode.Markdown)))
    {
        string content = reader.ReadToEnd();
        using (TextWriter textWriter = File.CreateText("/path/word-to-markdown.md"))
        {
            textWriter.Write(content);
        }
    }
}

Получите бесплатную лицензию API

Вы можете получить бесплатную временную лицензию, чтобы использовать API без ограничений пробной версии.

Вывод

Подводя итог, мы научились преобразовывать файлы Word в формат уценки с помощью C# в наших приложениях .NET. Вы можете использовать эту функцию в своем приложении. Вы можете расширить свое приложение, используя другие доступные функции API.

Узнайте больше о .NET Parser API, воспользовавшись его документацией и ознакомившись с примерами, доступными на GitHub. Свяжитесь с нами по любому вопросу через форум.

Смотрите также