Хвилюєтеся щодо об’єднання або розділення документів різних типів на кількох платформах? У вашій голові може бути багато тверджень:

  • Як об’єднати PDF-документи в Java?
  • Хочете розділити документи Word або об’єднати електронні таблиці Excel.
  • Що робити, якщо мені потрібно об’єднати презентації PPT/PPTX.
  • Ще багато питань, список може не закінчуватися.
Розділіть або об’єднайте документи PDF, Word, Excel у Java
GroupDocs.Merger for Java

GroupDocs пропонує рішення для об’єднання документів для всіх таких вимог. Це API Java дозволяє вам об’єднувати документи та керувати структурою документів у Java в широкому діапазоні підтримуваних форматів документів. Крім того, це дозволяє маніпулювати сторінками документа, трансформувати сторінки, витягувати інформацію з документів, генерувати попередній перегляд і багато іншого.

У цій статті ми трохи розглянемо такі теми:

Зразок коду та кроки, описані нижче, використовують GroupDocs.Merger for Java, тому ви можете завантажити або інтегрувати його у свої програми на основі maven за допомогою конфігурацій pom.xml.

Об’єднайте PDF-файли в Java

Ми можемо об’єднати два або більше PDF-файлів у декілька рядків коду. Нижче наведено фрагмент коду з прикладів, який не потребує додаткових пояснень і тому показує, як об’єднати кілька документів PDF у Java. Кроки дуже прості, якщо ви визначилися з документами для об’єднання:

  • Створіть екземпляр об’єкта Merger з першим документом, з яким потрібно об’єднати інші документи.
  • Викличте метод join, передаючи документ для об’єднання.
  • Відкликати метод об’єднання, щоб об’єднати більше документів.
  • Викличте метод save, щоб зберегти кінцевий результат.
  • Це воно.
// Set paths for the documents to join together in a single file.
String filePath1 = "document-1.pdf";
String filePath2 = "document-2.pdf";
String filePath3 = "document-3.pdf";
// Merger multiple PDF documents into a single PDF file.
Merger merger = new Merger(filePath1 );
merger.join(filePath2 ); // Joining 2nd Document
merger.join(filePath3 ); // Joining 3rd Document
// Save the merged document.
String filePathOutput = "mergedDocument.pdf";
merger.save(filePathOutput);

Об’єднайте документи Excel, Word, PowerPoint у Java

Ви можете поєднувати кілька документів Word, електронних таблиць Excel, презентацій PowerPoint, фактично, майже будь-які документи одного формату. Наведений вище код об’єднання документів PDF можна використовувати для об’єднання різноманітних документів. У кінці статті я згадаю список форматів файлів, які можна об’єднати одним кодом. Тут для прикладу я показую, як подібним чином можна об’єднати більше двох документів Word в один файл Word лише за допомогою кількох рядків коду Java.

// Merger multiple Word documents into a single DOCX file.
Merger merger = new Merger("document1.docx" );
merger.join("document2.docx" ); // Joining 2nd Document
merger.join("document3.docx" ); // Joining 3rd Document
// Save the merged document.
merger.save("mergedDocument.pdf");

Об’єднати сторінки документа в Java

Кілька документів можна об’єднати за допомогою вибраних сторінок, а також шляхом визначення бажаного діапазону сторінок. Ваш код залишиться подібним до згаданого вище, лише трохи змінивши параметри об’єднання за допомогою класу JoinOptions.

Нижче наведено фрагмент вихідного коду, який показує, як об’єднати документи, вказавши певні сторінки.

// Set the start and end page number in JoinOptions class.
JoinOptions joinOptions = new JoinOptions(1, 2);
// Merge two files with selective pages using join method.
Merger merger = new Merger("document-1.docx");
merger.join("document-2.docx" , joinOptions);
merger.save("merged-Document.docx");

Розбийте документи на кілька документів у Java

Подібно до того, як ми об’єднали документи вище, ми також можемо різними способами швидко розділити документи Word, електронні таблиці Excel, презентації, PDF-файли та багато інших документів.

  • Розбити за точними номерами сторінок
  • Розділити документ на кілька багатосторінкових документів
  • Розділити за діапазоном сторінок
  • Розділ на парні та непарні сторінки

Розділ за точними номерами сторінок

Ми можемо розділити документ, надавши точну кількість сторінок у Java. Наступний код розділить PDF-файл на 3 документи, кожен з яких має одну сторінку.

  • Ініціалізуйте об’єкт SplitOptions вихідним файлом і режимом для розділення.
  • Створіть екземпляр об’єкта Merger із вихідним файлом або потоком, який потрібно розділити.
  • Викличте метод split, щоб розділити наданий документ і зберегти його.
String filePath = "document.pdf";
String filePathOut = "document\_{0}.{1}";
// Split the document into multiple single page documents.
SplitOptions splitOptions = new SplitOptions(filePathOut, new int\[\] { 3, 6, 8 });
Merger merger = new Merger(filePath);
merger.split(splitOptions);

Розділити документ на багатосторінкові документи

Якщо у вас є документ із 6 сторінками, згадана нижче невелика зміна у наведеному вище коді розділить ваш документ на 3 окремі документи таким чином:

Назва документа Номери сторінок
документ1 1, 2
документ2 3, 4, 5
документ3 6
SplitOptions splitOptions = new SplitOptions(filePathOut,  SplitMode.Interval, new int\[\] { 3, 6 },);

Розділити за діапазоном початкової та кінцевої сторінок

Якщо ви хочете розділити будь-який документ, лише вказавши діапазон сторінок, ось як презентацію Powerpoint можна розділити на 3 односторінкові презентації.

String filePath = "presentation.ppt";
String filePathOut = "presentation\_{0}.{1}";
// Split the presentation into multiple single page presentations.
SplitOptions splitOptions = new SplitOptions(filePathOut, 3, 5);
Merger merger = new Merger(filePath);
merger.split(splitOptions)

Поділити на парні чи непарні діапазони сторінок

Ви можете розділити діапазони парних і непарних сторінок. Наступні параметри SplitOptions дозволять розділити наданий документ на кілька односторінкових документів для непарних сторінок у діапазоні від 3 до 8.

SplitOptions splitOptions = new SplitOptions(filePathOut, 3, 8, RangeMode.OddPages);

Підтримувані формати документів

Як і було обіцяно, ось список форматів документів, які можна об’єднати або розділити з наведеними вище прикладами. Ви можете будь-коли відвідати docs, щоб перевірити оновлений список.

Тип документа Формати файлів
Обробка тексту DOC, DOCX, DOCM, DOT, DOTX, DOTM, ODT, OTT, RTF, TXT
Електронні таблиці XLS, XLSX, XLSM, XLSB, XLT, XLTX, XLTM, ODS, CSV, TSV
Презентації PPT, PPTX, PPS, PPSX, ODP, OTP
Креслення VSDX, VSDM, VSSX, VSSM, VSTX, VSTM, VDX, VSX, VTX
Веб HTML, MHT
Мови опису сторінки TEX, XPS
Електронні книги та інше PDF, EPUB, ONE

Радий бачити вас тут. Ви можете вільно зв’язуватися з нами на форумі, якщо у вас виникнуть труднощі, виникнуть якісь непорозуміння або ви захочете надати хороші пропозиції.

Дивись також