Bạn lo lắng về việc hợp nhất hoặc chia nhỏ các loại tài liệu trong nhiều nền tảng? Có thể có nhiều tuyên bố trong tâm trí của bạn:

  • Làm cách nào để hợp nhất các tài liệu PDF với nhau trong Java?
  • Muốn chia nhỏ văn bản word, hay gộp bảng tính excel.
  • Phải làm gì nếu tôi cần hợp nhất các bản trình bày PPT/PPTX.
  • Nhiều câu hỏi nữa, danh sách có thể không kết thúc.
Tách hoặc hợp nhất tài liệu PDF, Word, Excel trong Java
GroupDocs.Merger for Java

GroupDocs cung cấp giải pháp hợp nhất tài liệu cho tất cả các yêu cầu như vậy. Đó là API Java cho phép bạn hợp nhất tài liệu và thao tác cấu trúc tài liệu trong Java trên nhiều định dạng tài liệu được hỗ trợ. Nó còn cho phép thao tác với các trang tài liệu, chuyển đổi trang, trích xuất thông tin từ tài liệu, tạo bản xem trước, v.v.

Trong bài viết này, chúng ta sẽ xem xét một chút về các chủ đề sau:

Mẫu mã và các bước được giải thích bên dưới đang sử dụng GroupDocs.Merger for Java nên bạn có thể tải xuống hoặc tích hợp mã này vào các ứng dụng dựa trên maven của mình với cấu hình pom.xml.

Hợp nhất các tệp PDF trong Java

Chúng tôi có thể kết hợp hai hoặc nhiều tệp PDF chỉ trong một vài dòng mã. Dưới đây là đoạn mã từ ví dụ, đoạn mã này tự giải thích và không cần làm rõ thêm, do đó chỉ ra cách hợp nhất nhiều tài liệu PDF trong Java. Các bước rất đơn giản nếu bạn đã quyết định kết hợp các tài liệu với nhau:

  • Khởi tạo đối tượng Sáp nhập, với tài liệu đầu tiên mà các tài liệu khác sẽ được hợp nhất.
  • Gọi phương thức tham gia, chuyển tài liệu để hợp nhất.
  • Nhớ lại phương thức nối để hợp nhất nhiều tài liệu hơn.
  • Gọi phương thức save để lưu kết quả cuối cùng.
  • Đó là nó.
// Set paths for the documents to join together in a single file.
String filePath1 = "document-1.pdf";
String filePath2 = "document-2.pdf";
String filePath3 = "document-3.pdf";
// Merger multiple PDF documents into a single PDF file.
Merger merger = new Merger(filePath1 );
merger.join(filePath2 ); // Joining 2nd Document
merger.join(filePath3 ); // Joining 3rd Document
// Save the merged document.
String filePathOutput = "mergedDocument.pdf";
merger.save(filePathOutput);

Hợp nhất tài liệu Excel, Word, PowerPoint trong Java

Bạn có thể kết hợp nhiều tài liệu Word, Bảng tính Excel, bản trình bày PowerPoint, trên thực tế, hầu hết mọi tài liệu có cùng định dạng. Mã nối các tài liệu PDF ở trên có thể được sử dụng để hợp nhất nhiều loại tài liệu. Ở cuối bài viết, tôi sẽ đề cập đến danh sách các định dạng tệp có thể được hợp nhất với cùng một mã. Ở đây là một ví dụ, tôi đang chỉ ra cách tương tự như thế nào, nhiều hơn hai tài liệu Word có thể được kết hợp với nhau thành một tệp Word chỉ trong một vài dòng mã Java.

// Merger multiple Word documents into a single DOCX file.
Merger merger = new Merger("document1.docx" );
merger.join("document2.docx" ); // Joining 2nd Document
merger.join("document3.docx" ); // Joining 3rd Document
// Save the merged document.
merger.save("mergedDocument.pdf");

Hợp nhất các trang tài liệu trong Java

Nhiều tài liệu có thể được hợp nhất bởi các trang chọn lọc và cũng bằng cách chỉ định phạm vi trang mong muốn. Mã của bạn sẽ vẫn tương tự như đã đề cập ở trên, chỉ có một chút thay đổi trong khi đặt các tùy chọn hợp nhất của bạn bằng lớp JoinOptions.

Dưới đây là đoạn mã nguồn cho biết cách hợp nhất tài liệu bằng cách chỉ định các trang nhất định.

// Set the start and end page number in JoinOptions class.
JoinOptions joinOptions = new JoinOptions(1, 2);
// Merge two files with selective pages using join method.
Merger merger = new Merger("document-1.docx");
merger.join("document-2.docx" , joinOptions);
merger.save("merged-Document.docx");

Tách tài liệu thành nhiều tài liệu trong Java

Giống như cách hợp nhất tài liệu ở trên, chúng ta cũng có thể chia nhỏ tài liệu Word, bảng tính Excel, bản trình bày, tệp PDF và nhiều tài liệu khác một cách nhanh chóng theo nhiều cách khác nhau.

  • Chia theo số trang chính xác
  • Tách tài liệu thành nhiều tài liệu nhiều trang
  • Chia theo phạm vi trang
  • Chia theo trang chẵn và trang lẻ

Chia theo số trang chính xác

Chúng ta có thể tách một tài liệu bằng cách cung cấp số trang chính xác trong Java. Đoạn mã sau sẽ chia tệp PDF thành 3 tài liệu, mỗi tài liệu có một trang được đề cập.

  • Khởi tạo đối tượng SplitOptions với tệp đầu ra và chế độ chia nhỏ.
  • Khởi tạo đối tượng Sáp nhập với tệp nguồn hoặc luồng để tách.
  • Gọi phương thức split để tách tài liệu được cung cấp và lưu tài liệu đó.
String filePath = "document.pdf";
String filePathOut = "document\_{0}.{1}";
// Split the document into multiple single page documents.
SplitOptions splitOptions = new SplitOptions(filePathOut, new int\[\] { 3, 6, 8 });
Merger merger = new Merger(filePath);
merger.split(splitOptions);

Chia tài liệu thành nhiều tài liệu

Nếu bạn có một tài liệu gồm 6 trang, sửa đổi nhỏ được đề cập bên dưới trong đoạn mã trên sẽ chia tài liệu của bạn thành 3 tài liệu riêng biệt theo cách sau:

Tên tài liệu Số Trang
tài liệu1 1, 2
tài liệu2 3, 4, 5
tài liệu3 6
SplitOptions splitOptions = new SplitOptions(filePathOut,  SplitMode.Interval, new int\[\] { 3, 6 },);

Chia theo phạm vi trang bắt đầu và kết thúc

Nếu bạn muốn tách bất kỳ tài liệu nào bằng cách chỉ cung cấp phạm vi trang, thì đây là cách chia bản trình bày Powerpoint thành 3 bản trình bày trang đơn.

String filePath = "presentation.ppt";
String filePathOut = "presentation\_{0}.{1}";
// Split the presentation into multiple single page presentations.
SplitOptions splitOptions = new SplitOptions(filePathOut, 3, 5);
Merger merger = new Merger(filePath);
merger.split(splitOptions)

Chia theo phạm vi trang chẵn hoặc lẻ

Bạn có thể đặt phạm vi trang chẵn và lẻ để phân chia. Làm theo SplitOptions sẽ cho phép chia tài liệu được cung cấp thành nhiều tài liệu một trang cho các trang lẻ trong khoảng từ 3 đến 8.

SplitOptions splitOptions = new SplitOptions(filePathOut, 3, 8, RangeMode.OddPages);

Định dạng tài liệu được hỗ trợ

Như đã hứa, đây là danh sách các định dạng tài liệu có thể được hợp nhất hoặc chia nhỏ với các ví dụ trên. Bạn có thể truy cập docs bất cứ lúc nào để kiểm tra danh sách cập nhật.

Loại tài liệu Định dạng tệp
Xử Lý Văn Bản DOC, DOCX, DOCM, DOT, DOTX, DOTM, ODT, OTT, RTF, TXT
Bảng tính XLS, XLSX, XLSM, XLSB, XLT, XLTX, XLTM, ODS, CSV, TSV
Thuyết trình PPT, PPTX, PPS, PPSX, ODP, OTP
Bản vẽ VSDX, VSDM, VSSX, VSSM, VSTX, VSTM, VDX, VSX, VTX
Web HTML, MHT
Ngôn ngữ mô tả trang TEX, XPS
Sách điện tử & Khác PDF, EPUB, MỘT

Rất vui được gặp bạn ở đây, bạn có thể tự do liên hệ với chúng tôi trên diễn đàn trong trường hợp bạn cảm thấy khó khăn hoặc bối rối hoặc muốn đưa ra một số gợi ý hay.

Xem thêm