在这个数字世界中,几乎所有设备中都存在文字处理文档。同样,几乎每个文字处理编辑器都开始支持 markdown 格式。随着网页的不断增加,MD文件的不断增加,增加了Word内容到使用markdown格式的网站的转换。本文讨论如何使用 C# 以编程方式将 Word 文档转换为 markdown 文件。

在 C# 中将 Word 文档转换为 Markdown

.NET API 解析和转换 Markdown 文件

GroupDocs 展示了它的 .NET API,它允许在 .NET 应用程序中将 Word 文档解析和转换为其他格式。我们将使用它的 GroupDocs.Parser for .NET 来解析 Word DOC/DOCX 文件并将其转换为 MD 文件。此外,API 支持解析许多其他文件格式,例如 PDF、电子表格、演示文稿、电子书、标记文档、电子邮件格式、档案、图像以及 文档 中提到的许多其他格式。

您可以从 下载部分 下载 DLL 或 MSI 安装程序,或通过 NuGet 在您的 .NET 应用程序中安装 API。

PM> Install-Package GroupDocs.Parser

如何使用 C# 将 Word 转换为 Markdown

让我们快速跳转到目标并将 Microsoft Word 文档转换为 markdown 格式。以下步骤展示了如何使用 C# 将 Word DOC/DOCX 转换为 Markdown。

  • 使用 Parser 类加载 MS Word 文件。
  • 使用 FormattedTextOptions 类和 Markdown 模式获取加载文件的格式化文本。
  • 使用 ReadToEnd 方法阅读完整内容。
  • 通过使用 TextWriter 类的 Write 方法将内容写入 MD 文件,将其转换为 Markdown。

以下 C# 源代码将 MS Word docx 文件转换为 Markdown 格式。

using System.IO;
using GroupDocs.Parser.Options;
...
...
using (Parser parser = new Parser("/path/document.docx"))
{
    using (TextReader reader = parser.GetFormattedText(new FormattedTextOptions(FormattedTextMode.Markdown)))
    {
        string content = reader.ReadToEnd();
        using (TextWriter textWriter = File.CreateText("/path/word-to-markdown.md"))
        {
            textWriter.Write(content);
        }
    }
}

获取免费 API 许可证

您可以获得免费的临时许可证 使用 API 而不受评估限制。

结论

总而言之,我们学会了在 .NET 应用程序中使用 C# 将 Word 文件转换为 markdown 格式。您可以在应用程序中使用此功能。您可以使用 API 的其他可用功能来扩展您的应用程序。

使用 文档 并体验 GitHub 上提供的示例,了解有关 .NET Parser API 的更多信息。如有任何疑问,请通过 论坛 联系我们。

也可以看看