HTML 的清理和缩小可以提高网页的加载时间和带宽使用率。据观察,当使用某些工具将一个文档转换为 HTML 格式时,会注入一些不必要的代码。您可以在 .NET 应用程序中删除这些不需要的代码。本文讨论如何使用 C# 将 Word 文档呈现为缩小的 HTML

使用 C# 将 Word 呈现为干净的 HTML

.NET API 呈现为缩小的 HTML

GroupDocs.Viewer 提供了一个文档查看 API,允许将各种文档呈现为 HTML, .NET 应用程序中的 PDF 和图像格式。我将在示例中使用此 API 将 DOCX 文件转换为干净的 HTML 文件。

您可以从 下载部分 下载 DLL 或 MSI 安装程序,或通过 NuGet 在您的 .NET 应用程序中安装 API .org/packages/groupdocs.viewer)。

PM> Install-Package GroupDocs.Viewer

使用 C# 将 Word DOC/DOCX 渲染为缩小的 HTML

可以使用相应的方法通过嵌入式或外部资源获取 HTML 文件。以下步骤展示了如何使用 C# 将 Word 文档 (DOC/DOCX) 转换为缩小的 HTML。

  • 使用 Viewer 类加载 DOCX 文件。
  • 使用 HtmlViewOptions 类准备 HTML 呈现选项。
  • 通过将其设置为 true 来启用 Minify 选项。
  • 使用带有创建选项的 View() 将 DOCX 文件呈现为缩小的 HTML。

以下 C# 代码示例将 Word DOCX 文件呈现为缩小的 HTML。

// 使用 C# 将 Word DOC/DOCX 转换为缩小的 HTML
using (Viewer viewer = new Viewer("path/document.docx"))
{
    HtmlViewOptions options = HtmlViewOptions.ForEmbeddedResources("path/page_{0}.html");
    options.Minify = true;

    viewer.View(options);
}

获取免费 API 许可证

您可以通过 [获得临时许可证] (https://purchase.groupdocs.com/temporary-license) 免费使用这些 API,而不受评估限制。

结论

总而言之,我们讨论了如何使用 C# 将 DOC/DOCX 文件呈现为缩小的 HTML。您可以构建自己的在线转换器和清理器,允许用户将文档转换为缩小的 HTML。此外,您可以从其文档 中了解有关 GroupDocs.Viewer for .NET 的更多信息.如有疑问,请通过 论坛 联系我们。

也可以看看