DOC 和 DOCX 是用于起草官方和个人文件的最常见的文件格式。如果一个文档多次更改或者它有多个版本,您可以轻松地比较该文档的两个不同版本。对于作为 Java 程序员的您,本文讨论了如何比较两个 Word 文档以及如何突出 Java 中已识别的差异的基本方法。

比较 Word 文档以发现 Java 中的差异

用于比较 Word 文档的 Java API

GroupDocs 为不同平台提供文档和图像比较 API。我将使用它的 GroupDocs.Comparison for Java API 来比较 Word 文档。

您可以从 下载部分 下载 JAR 文件,或者只获取基于 maven 的 Java 应用程序的 pom.xml 的存储库和依赖项配置。

<repository>
	<id>GroupDocsJavaAPI</id>
	<name>GroupDocs Java API</name>
	<url>http://repository.groupdocs.com/repo/</url>
</repository>
<dependency>
        <groupId>com.groupdocs</groupId>
        <artifactId>groupdocs-comparison</artifactId>
        <version>22.3</version> 
</dependency>

比较 Java 中的 Word 文档

您可以比较文档的两个版本以查找添加、删除和更改的内容。结果,您将获得一个显示所有已识别更改的新文档。以下是比较任意两个 Word(DOC、DOCX)文档并突出它们的差异的步骤。

  • 首先,使用 Comparer 类加载第一个 Word 文档。
  • 然后,使用 add() 方法将第二个文件添加到 Comparer。
  • 最后,只需调用 compare() 方法即可比较并获取更改的摘要。

以下 Java 代码显示了如何比较 Word 文档并获取结果文档中的更改。

/*
 * 比较两个 Word 文档并突出显示 Java 中的更改
 */
try (Comparer comparer = new Comparer("path/document-ver1.docx")) {
    comparer.add("path/document-ver2.docx");
    final Path resultPath = comparer.compare("path/compared-result.docx");
}

获取免费 API 许可证

您可以获得免费的临时许可证 使用 API 而不受评估限制。

结论

综上所述,我们学习了在 Java 中比较两个 Word 文档(DOC/DOCX)的简单方法。作为输出,您获得了插入或删除内容的摘要。在另一篇文章中,我们将讨论比较受保护的word文档接受或拒绝已识别的更改的进一步方法。

尝试构建您自己的文档比较 Java 应用程序。您可以使用 文档API 参考 了解有关 API 的更多信息。

体验示例的简单方法来自 GitHub。如有任何疑问,请通过 论坛 联系我们。

也可以看看