Chuyển đổi DOCX sang HTML trong CSharp

Bạn muốn chuyển đổi tài liệu sang định dạng HTML để lấy nội dung cho trang web của mình hoặc bạn đã bắt gặp một trang web gửi tài liệu trực tuyến yêu cầu phải gửi tài liệu ở định dạng HTML. Trong cả hai trường hợp, bạn cần một trình chuyển đổi DOC sang HTML. Tuy nhiên, nếu bạn cần chuyển đổi tài liệu của mình sang HTML theo chương trình, thì bài viết này chỉ dành cho bạn. Bài viết này sẽ đề cập đến các cách sau để chuyển đổi tài liệu sang HTML trong C#:

  • Chuyển đổi đơn giản nhất các tài liệu như DOCX sang HTML trong C#.
  • Chuyển đổi sang HTML với các tùy chọn tùy chỉnh.
  • Chuyển đổi bằng tùy chọn hiển thị hoặc ẩn đường viền trang.

Thư viện chuyển đổi tài liệu C#

GroupDocs.Conversion for .NET là một API mạnh mẽ dễ sử dụng với khả năng chuyển đổi bất kỳ tài liệu nào từ danh sách rộng các định dạng tài liệu được hỗ trợ thành bất kỳ định dạng đích được hỗ trợ nào. Bạn có thể tải xuống API từ phần tải xuống hoặc cài đặt API từ NuGet.

Chuyển đổi DOCX sang HTML trong C# - Đơn giản

Đây là chuyển đổi đơn giản nhất và rất hữu ích. Tốt hơn tôi nên nói rằng bạn có thể chuyển đổi bất kỳ tài liệu nào của mình sang định dạng HTML. Chỉ cần kiểm tra định dạng của bạn từ danh sách định dạng được hỗ trợ và tiếp tục để chuyển đổi định dạng đó.

  • Tạo phiên bản của lớp Converter để bắt đầu với tài liệu nguồn của bạn.
  • Khởi tạo đối tượng MarkupConvertOptions.
  • Gọi phương thức Convert của lớp Converter.
  • Đó là nó.

Tài liệu của bạn sẽ được chuyển đổi sang HTML và tài liệu kết quả sẽ có trong kho lưu trữ của bạn. Mẫu mã nhỏ sau đây cho thấy quá trình chuyển đổi tệp DOCX thành HTML bằng cách sử dụng lớp Trình chuyển đổi trong C#.

// Converting DOCX to HTML in C#
using (Converter converter = new Converter("document.docx"))
{
    MarkupConvertOptions options = new MarkupConvertOptions();
    converter.Convert("converted.html", options);
}

Chuyển đổi DOC/DOCX sang HTML với Tùy chọn Tùy chỉnh

GroupDocs.Conversion cung cấp các tùy chọn khác để có được kết quả chuyển đổi mong muốn. Các tùy chọn tùy chỉnh bao gồm:

  • Bố cục cố định
  • Bố cục cố định - Show Borders
  • Định dạng
  • Số trang
  • trang
  • trang Count
  • Sử dụng PDF
  • Chữ ký ảnh
  • Phóng

Bạn có thể truy cập tài liệu hoặc mẫu GitHub để xem chi tiết từng tùy chọn. Tôi sẽ hiển thị một số tùy chỉnh trong khi chuyển đổi lại định dạng DOCX sang HTML trong mẫu mã bên dưới.

// Converting DOCX to HTML in C# with advance options.
using (Converter converter = new Converter("document.docx"))
{
    MarkupConvertOptions options = new MarkupConvertOptions
    { // Setting customized options
        PageNumber = 2,
        PagesCount = 1,
        FixedLayout = true
    };
    converter.Convert("converted.html", options);
}

Chuyển đổi DOC/DOCX sang HTML - Hiển thị hoặc ẩn đường viền trang

Cuối cùng nhưng không kém phần quan trọng, giờ đây bạn có thể kiểm soát mức độ hiển thị của đường viền trang trong khi chuyển đổi tài liệu sang HTML trong C#. GroupDocs.Conversion dành cho .NET trao quyền kiểm soát này cho các lập trình viên C#. Ví dụ dưới đây cho thấy rằng bằng cách đặt thuộc tính FixedLayoutShowBorders của lớp MarkupConvertOptions thành true hoặc false, bạn có thể hiển thị hoặc ẩn đường viền trang trong tài liệu HTML kết quả.

// Converting DOCX to HTML in C# with show or hide borders control.
using (Converter converter = new Converter("document.docx"))
{
    MarkupConvertOptions options = new MarkupConvertOptions
    {
        PageNumber = 2,
        FixedLayout = true,
        PagesCount = 1,
        FixedLayoutShowBorders = false
    };
    converter.Convert("converted.html", options);
}

Hình ảnh bên dưới hiển thị tài liệu DOCX gốc và HTML đã chuyển đổi có và không có viền trang.

Tài liệu Docx để chuyển đổi thành HTML

Tài liệu DOCX gốc

Tệp HTML có viền trang và không có viền.

Hình trên cho thấy các tệp HTML được chuyển đổi từ DOCX với các tùy chọn hiển thị đường viền và không hiển thị đường viền.

Tìm hiểu thêm về GroupDocs.Conversion

Hãy nói chuyện nhiều hơn @ Diễn đàn hỗ trợ miễn phí.