Les documents de traitement de texte sont présents dans presque tous les appareils de ce monde numérique. De même, presque tous les éditeurs de traitement de texte ont commencé à prendre en charge le format Markdown. L’augmentation continue des fichiers MD au fur et à mesure que les pages Web augmentent la transformation du contenu Word en sites Web utilisant le format Markdown. Cet article explique comment convertir par programmation des documents Word en fichiers Markdown à l’aide de C#.

Convertir un document Word en Markdown en C#

API .NET pour analyser et convertir les fichiers Markdown

GroupDocs présente son API .NET qui permet l’analyse et la conversion de documents Word dans d’autres formats au sein des applications .NET. Nous utiliserons son GroupDocs.Parser for .NET pour analyser et transformer les fichiers Word DOC/DOCX en fichiers MD. De plus, l’API prend en charge l’analyse de nombreux autres formats de fichiers tels que les PDF, les feuilles de calcul, les présentations, les livres électroniques, les documents de balisage, les formats de courrier électronique, les archives, les images et bien d’autres mentionnés dans la documentation.

Vous pouvez télécharger les DLL ou le programme d’installation MSI à partir de la section des téléchargements ou installer l’API dans votre application .NET via NuGet.

PM> Install-Package GroupDocs.Parser

Comment convertir Word en Markdown en utilisant C#

Passons rapidement à l’objectif et transformons le document Microsoft Word au format Markdown. Les étapes suivantes montrent comment convertir le Word DOC/DOCX en Markdown à l’aide de C#.

  • Chargez le fichier MS Word à l’aide de la classe Parser.
  • Obtenez le texte formaté du fichier chargé à l’aide de la classe FormattedTextOptions et du mode Markdown.
  • Lisez le contenu complet à l’aide de la méthode ReadToEnd.
  • Convertissez-le en Markdown en écrivant le contenu dans un fichier MD à l’aide de la méthode Write de la classe TextWriter.

Le code source C# suivant convertit le fichier docx MS Word au format Markdown.

using System.IO;
using GroupDocs.Parser.Options;
...
...
using (Parser parser = new Parser("/path/document.docx"))
{
    using (TextReader reader = parser.GetFormattedText(new FormattedTextOptions(FormattedTextMode.Markdown)))
    {
        string content = reader.ReadToEnd();
        using (TextWriter textWriter = File.CreateText("/path/word-to-markdown.md"))
        {
            textWriter.Write(content);
        }
    }
}

Obtenez une licence API gratuite

Vous pouvez obtenir une licence temporaire gratuite pour utiliser l’API sans les limitations d’évaluation.

Conclusion

Pour résumer, nous avons appris à convertir des fichiers Word au format Markdown en utilisant C# dans nos applications .NET. Vous pouvez utiliser cette fonctionnalité dans votre application. Vous pouvez étendre votre application en utilisant d’autres fonctionnalités disponibles de l’API.

Apprenez-en plus sur .NET Parser API en utilisant sa documentation et en découvrant les exemples disponibles sur GitHub. Contactez-nous pour toute question via le forum.

Voir également