在這個數字世界中,幾乎每台設備都存在文字處理文檔。同樣,幾乎所有的文字處理編輯器都開始支持 markdown 格式。 MD文件隨著網頁的不斷增加,增加了Word內容到markdown格式網站的轉化。本文討論如何使用 C# 以編程方式將 Word 文檔轉換為 markdown 文件。

在 C# 中將 Word 文檔轉換為 Markdown

用於解析和轉換 Markdown 文件的 .NET API

GroupDocs 展示了其 .NET API,允許在 .NET 應用程序中將 Word 文檔解析和轉換為其他格式。我們將使用它的 GroupDocs.Parser for .NET 來解析 Word DOC/DOCX 文件並將其轉換為 MD 文件。此外,該 API 支持解析許多其他文件格式,如 PDF、電子表格、演示文稿、電子書、標記文檔、電子郵件格式、檔案、圖像以及 文檔 中提到的許多其他文件格式。

您可以從 下載部分 下載 DLL 或 MSI 安裝程序,或通過 NuGet 在您的 .NET 應用程序中安裝 API。

PM> Install-Package GroupDocs.Parser

如何使用 C# 將 Word 轉換為 Markdown

讓我們快速跳轉到目標,將 Microsoft Word 文檔轉換為 markdown 格式。以下步驟展示瞭如何使用 C# 將 Word DOC/DOCX 轉換為 Markdown。

  • 使用 Parser 類加載 MS Word 文件。
  • 使用 FormattedTextOptions 類和 Markdown 模式獲取加載文件的格式化文本。
  • 使用 ReadToEnd 方法閱讀完整內容。
  • 使用 TextWriter 類的 Write 方法將內容寫入 MD 文件,將其轉換為 Markdown。

以下 C# 源代碼將 MS Word docx 文件轉換為 Markdown 格式。

using System.IO;
using GroupDocs.Parser.Options;
...
...
using (Parser parser = new Parser("/path/document.docx"))
{
    using (TextReader reader = parser.GetFormattedText(new FormattedTextOptions(FormattedTextMode.Markdown)))
    {
        string content = reader.ReadToEnd();
        using (TextWriter textWriter = File.CreateText("/path/word-to-markdown.md"))
        {
            textWriter.Write(content);
        }
    }
}

獲取免費的 API 許可證

您可以 獲得免費的臨時許可證 以不受評估限制地使用 API。

結論

總而言之,我們學會了在 .NET 應用程序中使用 C# 將 Word 文件轉換為 markdown 格式。您可以在您的應用程序中使用此功能。您可以使用 API 的其他可用功能來擴展您的應用程序。

使用其 文檔 並體驗 GitHub 上提供的示例,了解有關 .NET Parser API 的更多信息。如有任何疑問,請通過 論壇 聯繫我們。

也可以看看