Textverarbeitungsdokumente sind in fast jedem Gerät dieser digitalen Welt vorhanden. In ähnlicher Weise unterstützte fast jeder Textverarbeitungseditor das Markdown-Format. Die kontinuierliche Zunahme von MD-Dateien als Webseiten erhöht die Umwandlung von Word-Inhalten in Websites im Markdown-Format. In diesem Artikel wird erläutert, wie Sie Word-Dokumente mithilfe von C# programmgesteuert in Markdown-Dateien konvertieren.

Konvertieren Sie ein Word-Dokument in C# in Markdown

.NET-API zum Analysieren und Konvertieren von Markdown-Dateien

GroupDocs präsentiert seine .NET-API, die das Parsing und die Konvertierung von Word-Dokumenten in andere Formate innerhalb der .NET-Anwendungen ermöglicht. Wir werden seinen GroupDocs.Parser for .NET zum Analysieren und Umwandeln von Word DOC/DOCX-Dateien in MD-Dateien verwenden. Darüber hinaus unterstützt die API das Parsen vieler anderer Dateiformate wie PDFs, Tabellenkalkulationen, Präsentationen, eBooks, Markup-Dokumente, E-Mail-Formate, Archive, Bilder und viele andere, die in der Dokumentation erwähnt werden.

Sie können die DLLs oder das MSI-Installationsprogramm aus dem Download-Bereich herunterladen oder die API in Ihrer .NET-Anwendung über NuGet installieren.

PM> Install-Package GroupDocs.Parser

So konvertieren Sie Word mit C# in Markdown

Lassen Sie uns schnell zum Ziel springen und das Microsoft Word-Dokument in das Markdown-Format umwandeln. Die folgenden Schritte zeigen, wie Sie Word DOC/DOCX mit C# in Markdown konvertieren.

  • Laden Sie die MS Word-Datei mit der Klasse Parser.
  • Rufen Sie den formatierten Text der geladenen Datei mit der Klasse FormattedTextOptions und dem Markdown-Modus ab.
  • Lesen Sie den vollständigen Inhalt mit der ReadToEnd-Methode.
  • Konvertieren Sie es in Markdown, indem Sie den Inhalt mit der Methode Write der Klasse TextWriter in eine MD-Datei schreiben.

Der folgende C#-Quellcode konvertiert die MS Word docx-Datei in das Markdown-Format.

using System.IO;
using GroupDocs.Parser.Options;
...
...
using (Parser parser = new Parser("/path/document.docx"))
{
    using (TextReader reader = parser.GetFormattedText(new FormattedTextOptions(FormattedTextMode.Markdown)))
    {
        string content = reader.ReadToEnd();
        using (TextWriter textWriter = File.CreateText("/path/word-to-markdown.md"))
        {
            textWriter.Write(content);
        }
    }
}

Holen Sie sich eine kostenlose API-Lizenz

Sie können eine kostenlose temporäre Lizenz erhalten, um die API ohne die Evaluierungseinschränkungen zu verwenden.

Fazit

Zusammenfassend haben wir gelernt, Word-Dateien in unseren .NET-Anwendungen mit C# in das Markdown-Format zu konvertieren. Sie können diese Funktion in Ihrer Anwendung verwenden. Sie können Ihre Anwendung erweitern, indem Sie andere verfügbare Funktionen der API verwenden.

Erfahren Sie mehr über die .NET Parser-API anhand ihrer Dokumentation und anhand der auf GitHub verfügbaren Beispiele. Kontaktieren Sie uns bei Fragen über das Forum.

Siehe auch