Los documentos de procesamiento de texto están presentes en casi todos los dispositivos de este mundo digital. De manera similar, casi todos los editores de procesamiento de textos comenzaron a admitir el formato de rebajas. El aumento continuo de archivos MD como páginas web aumenta la transformación del contenido de Word en sitios web que utilizan el formato Markdown. Este artículo explica cómo convertir mediante programación documentos de Word en archivos Markdown usando C#.

Convertir documento de Word a Markdown en C#

.NET API para analizar y convertir archivos Markdown

GroupDocs presenta su API .NET que permite el análisis y la conversión de documentos de Word a otros formatos dentro de las aplicaciones .NET. Usaremos su GroupDocs.Parser for .NET para analizar y transformar archivos DOC/DOCX de Word en archivos MD. Además, la API admite el análisis de muchos otros formatos de archivo como PDF, hojas de cálculo, presentaciones, libros electrónicos, documentos de marcado, formatos de correo electrónico, archivos, imágenes y muchos otros mencionados en la documentación.

Puede descargar las DLL o el instalador MSI desde la sección de descargas o instalar la API en su aplicación .NET a través de NuGet.

PM> Install-Package GroupDocs.Parser

Cómo convertir Word a Markdown usando C#

Pasemos rápidamente al objetivo y transformemos el documento de Microsoft Word en formato Markdown. Los siguientes pasos muestran cómo convertir Word DOC/DOCX a Markdown usando C#.

  • Cargue el archivo de MS Word usando la clase Parser.
  • Obtenga el texto formateado del archivo cargado usando la clase FormattedTextOptions y el modo Markdown.
  • Lea el contenido completo utilizando el método ReadToEnd.
  • Conviértalo a Markdown escribiendo el contenido en un archivo MD utilizando el método Write de la clase TextWriter.

El siguiente código fuente de C# convierte el archivo docx de MS Word al formato Markdown.

using System.IO;
using GroupDocs.Parser.Options;
...
...
using (Parser parser = new Parser("/path/document.docx"))
{
    using (TextReader reader = parser.GetFormattedText(new FormattedTextOptions(FormattedTextMode.Markdown)))
    {
        string content = reader.ReadToEnd();
        using (TextWriter textWriter = File.CreateText("/path/word-to-markdown.md"))
        {
            textWriter.Write(content);
        }
    }
}

Obtenga una licencia de API gratuita

Puede obtener una licencia temporal gratuita para usar la API sin las limitaciones de evaluación.

Conclusión

En resumen, aprendimos a convertir archivos de Word en formato Markdown usando C# dentro de nuestras aplicaciones .NET. Puede utilizar esta característica dentro de su aplicación. Puede ampliar su aplicación utilizando otras funciones disponibles de la API.

Obtenga más información sobre .NET Parser API usando su documentación y experimentando los ejemplos disponibles en GitHub. Contacta con nosotros para cualquier consulta a través del foro.

Ver también