Thu nhỏ HTML cải thiện hiệu suất ứng dụng web với thời gian tải và sử dụng băng thông hiệu quả. Các phần mã không cần thiết, khoảng trắng không đáng kể, nhận xét, dấu chấm phẩy, giá trị màu trong HTML và CSS được tối ưu hóa trong quá trình thu nhỏ. Hãy tự động hóa quy trình để loại bỏ mã không mong muốn và nâng cao hiệu quả trong các ứng dụng Java của bạn. Để cải thiện hiệu suất, bài viết này thảo luận về cách kết xuất tài liệu Word thành HTML rút gọn trong Java.

Kết xuất tài liệu Word dưới dạng HTML sạch trong Java

API Java để hiển thị dưới dạng HTML được rút gọn

GroupDocs.Viewer giới thiệu API xem tài liệu cho phép hiển thị nhiều loại tài liệu khác nhau thành Các định dạng HTML, PDF và hình ảnh trong các ứng dụng Java. Tôi sẽ sử dụng API này trong ví dụ để chuyển đổi tệp Microsoft Word DOCX thành tệp HTML sạch.

Bạn có thể tải xuống tệp JAR từ phần tải xuống hoặc sử dụng cấu hình phụ thuộc và kho lưu trữ mới nhất Maven trong các ứng dụng Java của mình.

<repository>
	<id>GroupDocsArtifactRepository</id>
	<name>GroupDocs Artifact Repository</name>
	<url>https://repository.groupdocs.com/repo/</url>
</repository>

<dependency>
        <groupId>com.groupdocs</groupId>
        <artifactId>groupdocs-viewer</artifactId>
        <version>21.11.1</version> 
</dependency>

Kết xuất Word DOC/DOCX thành HTML được rút gọn trong Java

Các tệp HTML có thể được tạo bằng các tài nguyên được nhúng hoặc bên ngoài bằng các phương pháp tương ứng. Các bước sau đây cho biết cách kết xuất tài liệu Word (DOC/DOCX) thành HTML rút gọn trong Java.

  • Tải tệp DOCX bằng lớp Viewer.
  • Chuẩn bị các tùy chọn hiển thị HTML bằng cách sử dụng lớp HtmlViewOptions.
  • Kích hoạt tùy chọn thu nhỏ bằng cách đặt nó thành true.
  • Sử dụng chế độ xem() với các tùy chọn đã tạo để hiển thị tệp DOCX dưới dạng HTML được rút gọn.

Ví dụ mã Java sau đây hiển thị tệp Word DOCX thành HTML được rút gọn.

// Chuyển đổi Word DOC/DOCX thành HTML được rút gọn trong Java
Viewer viewer = new Viewer("path/document.docx");

HtmlViewOptions viewOptions = HtmlViewOptions.forEmbeddedResources("path/page_{0}.html");
viewOptions.setMinify(true);

viewer.view(viewOptions);

Nhận giấy phép API miễn phí

Bạn có thể sử dụng API miễn phí mà không bị giới hạn đánh giá bằng cách xin giấy phép tạm thời.

Sự kết luận

Để kết luận, bài viết này đã thảo luận cách hiển thị các tệp DOC/DOCX dưới dạng HTML được rút gọn trong Java. Bạn có thể phát triển trình chuyển đổi tài liệu trực tuyến và trình rút gọn HTML của riêng mình để cho phép người dùng chuyển đổi tài liệu thành HTML được rút gọn. Ngoài ra, bạn có thể tìm hiểu thêm về GroupDocs.Viewer for Java từ tài liệu của nó. Nếu có thắc mắc, hãy liên hệ với chúng tôi qua diễn đàn.

Xem thêm