担心在多个平台合并或拆分各种类型的文档?你的脑海里可能有很多陈述:
- 如何在 Java 中合并 PDF 文档?
- 想要拆分word文档,或者合并excel电子表格。
- 如果我需要合并 PPT/PPTX 演示文稿怎么办。
- 更多问题,列表可能不会结束。


GroupDocs 为所有此类需求提供了文档合并解决方案。它的 Java API 允许您在各种受支持的文档格式中合并文档和操纵 Java 中的文档结构。它还允许操作文档页面、页面转换、从文档中提取信息、生成预览等等。
在本文中,我们将了解以下主题:
下面解释的代码示例和步骤使用 GroupDocs.Merger for Java,因此您可以 下载 或将其集成到您的基于 maven 的应用程序中并使用 pom.xml 配置。
在 Java 中合并 PDF 文件
我们只需几行代码就可以组合两个或多个 PDF 文件。下面是来自 examples 的代码片段,它是不言自明的,无需进一步说明,因此展示了如何在 Java 中合并多个 PDF 文档。如果您已经决定要合并的文档,步骤非常简单:
// Set paths for the documents to join together in a single file.
String filePath1 = "document-1.pdf";
String filePath2 = "document-2.pdf";
String filePath3 = "document-3.pdf";
// Merger multiple PDF documents into a single PDF file.
Merger merger = new Merger(filePath1 );
merger.join(filePath2 ); // Joining 2nd Document
merger.join(filePath3 ); // Joining 3rd Document
// Save the merged document.
String filePathOutput = "mergedDocument.pdf";
merger.save(filePathOutput);
在 Java 中合并 Excel、Word、PowerPoint 文档
您可以组合多个 Word 文档、Excel 电子表格、PowerPoint 演示文稿,事实上,几乎任何相同格式的文档。上述加入 PDF 文档的代码可用于合并各种文档。在文章的底部,我会提到可以与相同代码合并的文件格式列表。这里举个例子,我展示了如何类似地,只需几行 Java 代码就可以将两个以上的 Word 文档组合成一个 Word 文件。
// Merger multiple Word documents into a single DOCX file.
Merger merger = new Merger("document1.docx" );
merger.join("document2.docx" ); // Joining 2nd Document
merger.join("document3.docx" ); // Joining 3rd Document
// Save the merged document.
merger.save("mergedDocument.pdf");
在 Java 中合并文档页面
多个文档可以通过选择性页面合并,也可以通过指定所需的页面范围来合并。您的代码将与上述类似,只是在使用 JoinOptions 类设置合并选项时稍作更改。
下面是显示如何通过指定某些页面来合并文档的源代码片段。
// Set the start and end page number in JoinOptions class.
JoinOptions joinOptions = new JoinOptions(1, 2);
// Merge two files with selective pages using join method.
Merger merger = new Merger("document-1.docx");
merger.join("document-2.docx" , joinOptions);
merger.save("merged-Document.docx");
在 Java 中将文档拆分为多个文档
就像我们在上面合并文档一样,我们也可以通过不同的方式快速拆分 Word 文档、Excel 电子表格、演示文稿、PDF 文件和许多其他文档。
- 按确切的页码拆分
- 将一个文档拆分为多个多页文档
- 按页面范围拆分
- 按偶数页和奇数页拆分
按确切页码拆分
我们可以通过在 Java 中提供确切的页数来拆分文档。以下代码将 PDF 文件拆分为 3 个文档,每个文档都有提到的单页。
- 使用输出文件和模式初始化 SplitOptions 对象以进行拆分。
- 使用要拆分的源文件或流实例化 Merger 对象。
- 调用 split 方法拆分提供的文档并保存。
String filePath = "document.pdf";
String filePathOut = "document\_{0}.{1}";
// Split the document into multiple single page documents.
SplitOptions splitOptions = new SplitOptions(filePathOut, new int\[\] { 3, 6, 8 });
Merger merger = new Merger(filePath);
merger.split(splitOptions);
将文档拆分为多页文档
如果您有一个 6 页的文档,下面提到的上述代码中的小修改将按照以下方式将您的文档拆分为 3 个单独的文档:
文件名稱 | 頁碼 |
---|---|
文檔_1 | 1, 2 |
文件_2 | 3, 4, 5 |
文件_3 | 6 |
SplitOptions splitOptions = new SplitOptions(filePathOut, SplitMode.Interval, new int\[\] { 3, 6 },);
按开始和结束页面范围拆分
如果您只想通过提供页面范围来拆分任何文档,以下是如何将 Powerpoint 演示文稿拆分为 3 个单页演示文稿。
String filePath = "presentation.ppt";
String filePathOut = "presentation\_{0}.{1}";
// Split the presentation into multiple single page presentations.
SplitOptions splitOptions = new SplitOptions(filePathOut, 3, 5);
Merger merger = new Merger(filePath);
merger.split(splitOptions)
按偶数或奇数页范围分割
您可以将偶数页和奇数页范围设置为拆分。遵循 SplitOptions 将允许将提供的文档拆分为多个一页文档,用于 3 到 8 范围内的奇数页。
SplitOptions splitOptions = new SplitOptions(filePathOut, 3, 8, RangeMode.OddPages);
支持的文档格式
正如所承诺的,这里是可以与上述示例合并或拆分的文档格式列表。您可以随时访问 docs 查看更新后的列表。
文件類型 | 文件格式 |
---|---|
文字處理 | DOC、DOCX、DOCM、DOT、DOTX、DOTM、ODT、OTT、RTF、TXT |
電子表格 | XLS、XLSX、XLSM、XLSB、XLT、XLTX、XLTM、ODS、CSV、TSV |
演講 | PPT、PPTX、PPS、PPSX、ODP、OTP |
圖紙 | VSDX、VSDM、VSSX、VSSM、VSTX、VSTM、VDX、VSX、VTX |
網站 | HTML, MHT |
頁面描述語言 | TEX、XPS |
電子書及其他 | PDF, EPUB, ONE |
很高兴在这里见到您,如果您有任何困难或困惑或想提出一些好的建议,您可以在 论坛 上自由联系我们。