Làm sạch và giảm thiểu HTML cải thiện thời gian tải và sử dụng băng thông của các trang web. Người ta quan sát thấy rằng một số mã không cần thiết được đưa vào khi một tài liệu được chuyển đổi sang định dạng HTML bằng một số công cụ. Bạn có thể loại bỏ mã không mong muốn này trong các ứng dụng .NET của mình. Bài viết này thảo luận về cách kết xuất tài liệu Word thành HTML rút gọn bằng C#.

Kết xuất Word dưới dạng HTML sạch bằng C#

.NET API để hiển thị dưới dạng HTML được rút gọn

GroupDocs.Viewer cung cấp API xem tài liệu cho phép hiển thị các tài liệu khác nhau thành HTML, PDF và các định dạng hình ảnh trong ứng dụng .NET. Tôi sẽ sử dụng API này trong các ví dụ để chuyển đổi tệp DOCX thành tệp HTML sạch.

Bạn có thể tải xuống trình cài đặt DLL hoặc MSI từ phần tải xuống hoặc cài đặt API trong ứng dụng .NET của bạn qua [NuGet](https://www.nuget .org/packages/groupdocs.viewer).

PM> Install-Package GroupDocs.Viewer

Kết xuất Word DOC/DOCX thành HTML được rút gọn bằng C#

Các tệp HTML có thể được lấy bằng các tài nguyên được nhúng hoặc bên ngoài bằng các phương pháp tương ứng. Các bước sau đây cho biết cách chuyển đổi tài liệu Word (DOC/DOCX) thành HTML rút gọn bằng C#.

  • Tải tệp DOCX bằng lớp Viewer.
  • Chuẩn bị các tùy chọn hiển thị HTML bằng cách sử dụng lớp HtmlViewOptions.
  • Kích hoạt tùy chọn Thu nhỏ bằng cách đặt thành đúng.
  • Sử dụng View() với các tùy chọn đã tạo để hiển thị tệp DOCX dưới dạng HTML được rút gọn.

Ví dụ về mã C# sau đây hiển thị tệp Word DOCX thành HTML được rút gọn.

// Chuyển đổi Word DOC/DOCX sang HTML được rút gọn bằng C#
using (Viewer viewer = new Viewer("path/document.docx"))
{
    HtmlViewOptions options = HtmlViewOptions.ForEmbeddedResources("path/page_{0}.html");
    options.Minify = true;

    viewer.View(options);
}

Nhận giấy phép API miễn phí

Bạn có thể sử dụng API miễn phí mà không bị giới hạn đánh giá bằng cách xin giấy phép tạm thời.

Sự kết luận

Tóm lại, chúng ta đã thảo luận cách hiển thị các tệp DOC/DOCX dưới dạng HTML được rút gọn bằng C#. Bạn có thể xây dựng Trình chuyển đổi và Trình dọn dẹp Trực tuyến của riêng mình để cho phép người dùng chuyển đổi tài liệu thành HTML được rút gọn. Ngoài ra, bạn có thể tìm hiểu thêm về GroupDocs.Viewer for .NET từ tài liệu của nó . Nếu có thắc mắc, hãy liên hệ với chúng tôi qua diễn đàn.

Xem thêm