Documentos de processamento de texto estão presentes em quase todos os dispositivos neste mundo digital. Da mesma forma, quase todos os editores de processamento de texto começaram a oferecer suporte ao formato markdown. O aumento contínuo de arquivos MD à medida que as páginas da Web aumentam a transformação do conteúdo do Word em sites usando o formato markdown. Este artigo discute como converter de forma programática documentos do Word em arquivos markdown usando C#.

Converter documento do Word para Markdown em C#

API .NET para analisar e converter arquivos Markdown

GroupDocs apresenta sua API .NET que permite a análise e conversão de documentos do Word em outros formatos dentro dos aplicativos .NET. Usaremos seu GroupDocs.Parser for .NET para analisar e transformar arquivos Word DOC/DOCX em arquivos MD. Além disso, a API suporta a análise de muitos outros formatos de arquivo, como PDFs, planilhas, apresentações, eBooks, documentos de marcação, formatos de e-mail, arquivos, imagens e muitos outros mencionados na documentação.

Você pode baixar as DLLs ou o instalador MSI da seção de downloads ou instalar a API em seu aplicativo .NET via NuGet.

PM> Install-Package GroupDocs.Parser

Como converter Word para Markdown usando C#

Vamos pular rapidamente para o objetivo e transformar o documento do Microsoft Word em formato markdown. As etapas a seguir mostram como converter o Word DOC/DOCX em Markdown usando C#.

  • Carregue o arquivo MS Word usando a classe Parser.
  • Obtenha o texto formatado do arquivo carregado usando a classe FormattedTextOptions e o modo Markdown.
  • Leia o conteúdo completo usando o método ReadToEnd.
  • Converta-o para Markdown gravando o conteúdo em um arquivo MD usando o método Write da classe TextWriter.

O código-fonte C# a seguir converte o arquivo docx do MS Word para o formato Markdown.

using System.IO;
using GroupDocs.Parser.Options;
...
...
using (Parser parser = new Parser("/path/document.docx"))
{
    using (TextReader reader = parser.GetFormattedText(new FormattedTextOptions(FormattedTextMode.Markdown)))
    {
        string content = reader.ReadToEnd();
        using (TextWriter textWriter = File.CreateText("/path/word-to-markdown.md"))
        {
            textWriter.Write(content);
        }
    }
}

Obtenha uma licença de API gratuita

Você pode obter uma licença temporária gratuita para usar a API sem as limitações de avaliação.

Conclusão

Para resumir, aprendemos a converter arquivos do Word em formato markdown usando C# em nossos aplicativos .NET. Você pode usar esse recurso em seu aplicativo. Você pode estender seu aplicativo usando outros recursos disponíveis da API.

Saiba mais sobre a .NET Parser API usando sua documentação e experimentando os exemplos disponíveis no GitHub. Contacte-nos para qualquer questão através do fórum.

Veja também