在 CSharp 中将 DOCX 转换为 HTML

要么您想将文档转换为 HTML 格式以获取您网站的内容,要么您遇到了要求以 HTML 格式提交文档的在线文档提交网站。无论哪种情况,您都需要一个DOC 到 HTML 转换器。但是,如果您需要以编程方式将文档转换为 HTML,那么本文仅供您参考。本文将介绍以下在 C# 中将文档转换为 HTML 的方法:

  • 在 C# 中将 DOCX 等文档最简单地转换为 HTML。
  • 使用自定义选项转换为 HTML。
  • 使用显示或隐藏页面边框的选项进行转换。

C# 文档转换库

GroupDocs.Conversion for .NET 是一个易于使用的强大 API,能够将 支持的文档格式 广泛列表中的任何文档转换为任何支持的目标格式。您可以从 下载 部分下载 API 或从 NuGet 安装它。

在 C# 中将 DOCX 转换为 HTML - 简单

这是最简单且非常有用的转换。我最好说您可以将任何文档转换为 HTML 格式。只需从 支持的格式列表 中检查您的格式,然后继续进行转换即可。

您的文档将被转换为 HTML,并且生成的文档将在您的存储库中。以下小代码示例显示了使用 C# 中的 Converter 类将 DOCX 文件转换为 HTML

// Converting DOCX to HTML in C#
using (Converter converter = new Converter("document.docx"))
{
    MarkupConvertOptions options = new MarkupConvertOptions();
    converter.Convert("converted.html", options);
}

使用自定义选项将 DOC/DOCX 转换为 HTML

GroupDocs.Conversion 提供了不同的其他选项来获得所需的转换结果。自定义选项包括:

  • 固定布局
  • 固定布局 - 显示边框
  • 格式
  • 页码
  • 页面
  • 页数
  • 使用 PDF
  • 水印
  • 飞涨

您可以访问 文档GitHub 示例 详细查看每个选项。我将在下面的代码示例中再次将 DOCX 转换为 HTML 格式时展示一些自定义项。

// Converting DOCX to HTML in C# with advance options.
using (Converter converter = new Converter("document.docx"))
{
    MarkupConvertOptions options = new MarkupConvertOptions
    { // Setting customized options
        PageNumber = 2,
        PagesCount = 1,
        FixedLayout = true
    };
    converter.Convert("converted.html", options);
}

将 DOC/DOCX 转换为 HTML - 显示或隐藏页面边框

最后但同样重要的是,您现在可以在使用 C# 将文档转换为 HTML 时控制页面边框的可见性。 GroupDocs.Conversion for .NET 将此控制权交给 C# 程序员。下面的示例显示,通过将 MarkupConvertOptions 类的 FixedLayoutShowBorders 属性设置为 true 或 false,您可以在生成的 HTML 文档中显示或隐藏页面边框。

// Converting DOCX to HTML in C# with show or hide borders control.
using (Converter converter = new Converter("document.docx"))
{
    MarkupConvertOptions options = new MarkupConvertOptions
    {
        PageNumber = 2,
        FixedLayout = true,
        PagesCount = 1,
        FixedLayoutShowBorders = false
    };
    converter.Convert("converted.html", options);
}

下面的图片显示了原始 DOCX 文档和转换后的带有和不带页面边框的 HTML。

Docx 文档转换成 HTML

原始 DOCX 文件

带有页面边框和无边框的 HTML 文件。

上图显示了从 DOCX 转换而来的带有显示边框和不显示边框选项的 HTML 文件。

了解有关 GroupDocs.Conversion 的更多信息

让我们多谈谈@ 免费支持论坛