Máte obavy ze sloučení nebo rozdělení dokumentů různých typů na více platformách? Ve vaší mysli může být mnoho prohlášení:

  • Jak sloučit dokumenty PDF dohromady v Java?
  • Chcete rozdělit dokumenty aplikace Word nebo sloučit tabulky aplikace Excel.
  • Co dělat, když potřebuji sloučit prezentace PPT/PPTX.
  • Mnoho dalších otázek, výčet možná nekončí.
Rozdělit nebo sloučit dokumenty PDF, Word, Excel v Java
GroupDocs.Merger pro Java

GroupDocs poskytuje řešení slučování dokumentů pro všechny takové požadavky. Jeho Java API vám umožňuje slučovat dokumenty a manipulovat se strukturou dokumentů v Java v celé řadě podporovaných formátů dokumentů. Dále umožňuje manipulaci se stránkami dokumentu, transformace stránek, extrakci informací z dokumentů, generování náhledů a mnoho dalšího.

V tomto článku se trochu podíváme na následující témata:

Ukázka kódu a kroky vysvětlené níže používají GroupDocs.Merger for Java, takže si jej můžete stáhnout nebo integrovat do svých aplikací založených na maven s konfiguracemi pom.xml.

Sloučit soubory PDF v Java

Můžeme spojit dva nebo více souborů PDF v několika řádcích kódu. Níže je uveden úryvek kódu z příklady, který je samozřejmý a nepotřebuje žádné další objasnění, proto ukazuje, jak sloučit více dokumentů PDF v Java. Kroky jsou velmi jednoduché, pokud jste se rozhodli dokumenty spojit:

  • Vytvořte instanci objektu Merger s prvním dokumentem, se kterým se mají sloučit další dokumenty.
  • Zavolejte metodu join a předejte dokument ke sloučení.
  • Vyvolejte metodu spojení pro sloučení více dokumentů.
  • Voláním metody save uložíte konečný výstup.
  • A je to.
// Set paths for the documents to join together in a single file.
String filePath1 = "document-1.pdf";
String filePath2 = "document-2.pdf";
String filePath3 = "document-3.pdf";
// Merger multiple PDF documents into a single PDF file.
Merger merger = new Merger(filePath1 );
merger.join(filePath2 ); // Joining 2nd Document
merger.join(filePath3 ); // Joining 3rd Document
// Save the merged document.
String filePathOutput = "mergedDocument.pdf";
merger.save(filePathOutput);

Sloučit dokumenty Excel, Word, PowerPoint v Java

Můžete kombinovat více dokumentů Wordu, tabulek Excelu, prezentací v PowerPointu, vlastně téměř všech dokumentů stejného formátu. Výše uvedený kód spojování dokumentů PDF lze použít ke sloučení široké škály dokumentů. V dolní části článku zmíním seznam formátů souborů, které lze sloučit se stejným kódem. Zde pro příklad ukazuji, jak podobně lze více než dva dokumenty aplikace Word spojit dohromady do jednoho souboru aplikace Word v několika řádcích kódu Java.

// Merger multiple Word documents into a single DOCX file.
Merger merger = new Merger("document1.docx" );
merger.join("document2.docx" ); // Joining 2nd Document
merger.join("document3.docx" ); // Joining 3rd Document
// Save the merged document.
merger.save("mergedDocument.pdf");

Sloučit stránky dokumentů v Java

Více dokumentů lze sloučit pomocí vybraných stránek a také zadáním požadovaného rozsahu stránek. Váš kód zůstane podobný výše uvedenému, jen malá změna při nastavování možností sloučení pomocí třídy JoinOptions.

Níže je uveden fragment zdrojového kódu, který ukazuje, jak sloučit dokumenty zadáním určitých stránek.

// Set the start and end page number in JoinOptions class.
JoinOptions joinOptions = new JoinOptions(1, 2);
// Merge two files with selective pages using join method.
Merger merger = new Merger("document-1.docx");
merger.join("document-2.docx" , joinOptions);
merger.save("merged-Document.docx");

Rozdělte dokumenty na více dokumentů v Java

Stejně jako jsme výše sloučili dokumenty, můžeme také rychle různými způsoby rozdělit dokumenty aplikace Word, tabulky Excel, prezentace, soubory PDF a mnoho dalších dokumentů.

  • Rozdělení podle přesných čísel stránek
  • Rozdělte dokument na několik vícestránkových dokumentů
  • Rozdělit podle rozsahu stránek
  • Rozdělení podle sudých a lichých stránek

Rozdělit podle přesných čísel stránek

Dokument můžeme rozdělit poskytnutím přesného počtu stránek v Java. Následující kód rozdělí soubor PDF na 3 dokumenty, z nichž každý má zmíněnou jednu stránku.

  • Inicializujte objekt SplitOptions s výstupním souborem a režimem rozdělení.
  • Vytvořte instanci objektu Merger se zdrojovým souborem nebo streamem, který chcete rozdělit.
  • Zavolejte metodu split pro rozdělení poskytnutého dokumentu a jeho uložení.
String filePath = "document.pdf";
String filePathOut = "document\_{0}.{1}";
// Split the document into multiple single page documents.
SplitOptions splitOptions = new SplitOptions(filePathOut, new int\[\] { 3, 6, 8 });
Merger merger = new Merger(filePath);
merger.split(splitOptions);

Rozdělit dokument na vícestránkové dokumenty

Pokud máte dokument se 6 stránkami, níže uvedená malá úprava výše uvedeného kódu rozdělí váš dokument na 3 samostatné dokumenty následujícím způsobem:

Název dokumentu Čísla stránek
dokument1 1, 2
dokument2 3, 4, 5
dokument3 6
SplitOptions splitOptions = new SplitOptions(filePathOut,  SplitMode.Interval, new int\[\] { 3, 6 },);

Rozdělit podle rozsahu počáteční a koncové stránky

Pokud chcete rozdělit jakýkoli dokument pouhým poskytnutím rozsahu stránek, zde je návod, jak lze prezentaci v Powerpointu rozdělit na 3 jednostránkové prezentace.

String filePath = "presentation.ppt";
String filePathOut = "presentation\_{0}.{1}";
// Split the presentation into multiple single page presentations.
SplitOptions splitOptions = new SplitOptions(filePathOut, 3, 5);
Merger merger = new Merger(filePath);
merger.split(splitOptions)

Rozdělit podle sudých nebo lichých rozsahů stránek

Můžete nastavit, aby se sudé a liché rozsahy stránek rozdělily. Následující SplitOptions umožní rozdělení poskytnutého dokumentu na více jednostránkových dokumentů pro liché stránky v rozsahu 3 až 8.

SplitOptions splitOptions = new SplitOptions(filePathOut, 3, 8, RangeMode.OddPages);

Podporované formáty dokumentů

Jak jsme slíbili, zde je seznam formátů dokumentů, které lze sloučit nebo rozdělit s výše uvedenými příklady. Aktualizovaný seznam můžete kdykoli zkontrolovat na docs.

Typ dokumentu Formáty souborů
Textový editor DOC, DOCX, DOCM, DOT, DOTX, DOTM, ODT, OTT, RTF, TXT
Tabulky XLS, XLSX, XLSM, XLSB, XLT, XLTX, XLTM, ODS, CSV, TSV
Prezentace PPT, PPTX, PPS, PPSX, ODP, OTP
Výkresy VSDX, VSDM, VSSX, VSSM, VSTX, VSTM, VDX, VSX, VTX
Web HTML, MHT
Popis stránky Jazyky TEX, XPS
e-knihy a další PDF, EPUB, ONE

Jsem rád, že vás tu vidím, můžete nás volně kontaktovat na fóru v případě, že máte nějaké potíže nebo máte nějaké nejasnosti nebo chcete dát nějaké dobré návrhy.

Viz také