DOC 和 DOCX 是用于起草官方和个人文件的最常见的文件格式。如果一个文档多次更改或者它有多个版本,您可以轻松地比较该文档的两个不同版本。对于作为 Java 程序员的您,本文讨论了如何比较两个 Word 文档以及如何突出 Java 中已识别的差异的基本方法。
用于比较 Word 文档的 Java API
GroupDocs 为不同平台提供文档和图像比较 API。我将使用它的 GroupDocs.Comparison for Java API 来比较 Word 文档。
您可以从 下载部分 下载 JAR 文件,或者只获取基于 maven 的 Java 应用程序的 pom.xml 的存储库和依赖项配置。
<repository>
<id>GroupDocsJavaAPI</id>
<name>GroupDocs Java API</name>
<url>http://repository.groupdocs.com/repo/</url>
</repository>
<dependency>
<groupId>com.groupdocs</groupId>
<artifactId>groupdocs-comparison</artifactId>
<version>22.3</version>
</dependency>
比较 Java 中的 Word 文档
您可以比较文档的两个版本以查找添加、删除和更改的内容。结果,您将获得一个显示所有已识别更改的新文档。以下是比较任意两个 Word(DOC、DOCX)文档并突出它们的差异的步骤。
- 首先,使用 Comparer 类加载第一个 Word 文档。
- 然后,使用 add() 方法将第二个文件添加到 Comparer。
- 最后,只需调用 compare() 方法即可比较并获取更改的摘要。
以下 Java 代码显示了如何比较 Word 文档并获取结果文档中的更改。
/*
* 比较两个 Word 文档并突出显示 Java 中的更改
*/
try (Comparer comparer = new Comparer("path/document-ver1.docx")) {
comparer.add("path/document-ver2.docx");
final Path resultPath = comparer.compare("path/compared-result.docx");
}
获取免费 API 许可证
您可以获得免费的临时许可证 使用 API 而不受评估限制。
结论
综上所述,我们学习了在 Java 中比较两个 Word 文档(DOC/DOCX)的简单方法。作为输出,您获得了插入或删除内容的摘要。在另一篇文章中,我们将讨论比较受保护的word文档和接受或拒绝已识别的更改的进一步方法。
尝试构建您自己的文档比较 Java 应用程序。您可以使用 文档 和 API 参考 了解有关 API 的更多信息。
体验示例的简单方法来自 GitHub。如有任何疑问,请通过 论坛 联系我们。