Việc hợp nhất các tài liệu khác nhau thường được yêu cầu khi bạn có ý định thu thập dữ liệu phân tán của các tài liệu khác nhau vào một tệp duy nhất. Trong bài viết này, bạn sẽ học cách tự động hóa quá trình hợp nhất tài liệu. Phần này sẽ chỉ ra cách lập trình hợp nhất nhiều tài liệu có cùng loại hoặc khác loại tệp vào một tệp bằng Java. Trong một bài đăng khác, chúng tôi đã thảo luận hợp nhất nhiều tệp có định dạng khác nhau bằng C#.
Các chủ đề sau đây được đề cập dưới đây:
- API Java - Hợp nhất nhiều tệp
- Hợp nhất các tệp PDF, Word, Excel thành một tệp PDF
- Hợp nhất các trang chọn lọc của nhiều tệp thành một tệp
API Java để hợp nhất nhiều loại tài liệu
Tôi sẽ sử dụng GroupDocs.Merger for Java để kết hợp các tài liệu có định dạng tệp khác nhau thành một tệp. API Java cho phép nối nhiều tài liệu có cùng định dạng hoặc khác nhau thành một tệp. Hơn nữa, nó cho phép tài liệu chia nhỏ, cắt, hoán đổi, di chuyển, xóa, xoay hoặc sắp xếp các trang cho phù hợp. Ngoài ra, nó hỗ trợ mật khẩu và loại bỏ chúng để quản lý tính bảo mật của các định dạng tài liệu được hỗ trợ.
Một số loại tài liệu mà API hỗ trợ bao gồm; tài liệu soạn thảo văn bản, bảng tính, bản trình bày, HTML, PDF, sách điện tử, bản vẽ Visio, CSV và TSV.
Tải xuống và định cấu hình
Lấy thư viện hợp nhất tài liệu từ phần tải xuống. Đối với các ứng dụng Java dựa trên Maven, hãy thêm cấu hình sau vào tệp pom.xml. Sau đó, bạn có thể thử các ví dụ java hợp nhất tài liệu của bài viết này cũng như nhiều ví dụ khác từ GitHub. Để biết chi tiết, bạn cũng có thể truy cập Tham chiếu API.
<repository>
<id>GroupDocsJavaAPI</id>
<name>GroupDocs Java API</name>
<url>http://repository.groupdocs.com/repo/</url>
</repository>
<dependency>
<groupId>com.groupdocs</groupId>
<artifactId>groupdocs-merger</artifactId>
<version>21.3</version>
</dependency>
Hợp nhất các tệp PDF, Word, Excel thành một tệp PDF trong Java
Tài liệu PDF có thể được kết hợp với tài liệu Word, bảng tính Excel, bản trình bày PowerPoint và các tài liệu PDF khác chỉ bằng một vài dòng mã. Sau đây là các bước về cách hợp nhất các tài liệu thuộc nhiều loại tệp thành một tệp.
- Tải tài liệu ban đầu bằng lớp Sáp nhập.
- Kết hợp tài liệu thứ hai bằng phương thức join.
- Tiếp tục hợp nhất các tài liệu khác (nếu cần) bằng cách sử dụng cùng một phương pháp nối hoặc tương tự.
- Lưu tài liệu được kết hợp cuối cùng trên đường dẫn hoặc luồng bằng phương pháp lưu có liên quan.
Mã nguồn sau đây cho biết cách hợp nhất các tài liệu PDF, Word và Excel thành một tệp PDF trong Java.
// Kết hợp hai hoặc nhiều loại tệp khác nhau thành một bằng Java
Merger merger = new Merger("pdf_document.pdf");
{
merger.join("word_document.docx");
merger.join("spreadsheet.xlsx");
merger.save("merged-document.pdf");
}
Tương tự, các tài liệu có cùng loại tệp có thể được kết hợp. Phần được đề cập dưới đây là đầu ra thu được bằng cách nối tài liệu từ, tài liệu PDF. và một bảng tính sử dụng mã Java nói trên.
Hợp nhất các trang chọn lọc của nhiều tệp PDF, Word, Excel thành một tệp PDF trong Java
Nếu bạn muốn chọn một vài trang từ một tài liệu và một số trang chọn lọc khác từ tài liệu tiếp theo, v.v. API cho phép bạn hợp nhất các trang chọn lọc của nhiều loại tệp thành một tệp theo nhiều cách khác nhau.
- Tải tài liệu ban đầu bằng lớp Sáp nhập.
- Chuẩn bị các tùy chọn hợp nhất với lớp JoinOptions.
- Bắt đầu hợp nhất tài liệu bằng phương thức join.
- Tiếp tục nối các tài liệu bằng cách đặt các tùy chọn nối thích hợp cho từng tài liệu.
- Lưu tài liệu đã hợp nhất cuối cùng bằng phương pháp save.
Mã nguồn sau đây cho biết cách hợp nhất trang đầu tiên của tài liệu Word và các trang chẵn của bảng tính Excel trong phạm vi được cung cấp trong Java với tài liệu PDF. Đầu ra sẽ là một tệp PDF duy nhất.
// Kết hợp các trang chọn lọc của hai hoặc nhiều loại tệp khác nhau thành một bằng Java
Merger merger = new Merger("pdf_document.pdf");
{
JoinOptions joinOptions = new JoinOptions(new int[]{1});
merger.join("word_document.docx", joinOptions);
joinOptions = new JoinOptions(1, 2, RangeMode.EvenPages);
merger.join("spreadsheet.xlsx", joinOptions);
merger.save("merged-document.pdf");
}
Nhận giấy phép API miễn phí
Bạn có thể nhận giấy phép tạm thời miễn phí để sử dụng API mà không bị giới hạn đánh giá.
Sự kết luận
Để kết thúc, bạn đã học cách hợp nhất hai hoặc nhiều tài liệu có loại tệp tương tự hoặc khác nhau thành một tệp bằng Java với ứng dụng của bạn. Ngoài ra, bạn đã học cách kết hợp các trang chọn lọc của nhiều loại tệp vào một tệp.
Bạn có thể tìm hiểu thêm về GroupDocs.Merger bằng cách sử dụng tài liệu. Trong trường hợp bạn có thắc mắc, hãy liên hệ với chúng tôi qua forum.