DOC 和 DOCX 是用於起草官方和個人文件的最常見的文件格式。如果一個文檔被多次更改或者它有多個版本,您可以輕鬆地比較該文檔的兩個不同版本。對於作為 Java 程序員的您,本文討論瞭如何比較兩個 Word 文檔以及如何在 Java 中突出顯示已識別差異的基本方法。

比較 Word 文檔以找出 Java 中的差異

用於比較 Word 文檔的 Java API

GroupDocs 提供了針對不同平台的文檔和圖像比較 API。我將使用其 GroupDocs.Comparison for Java API 來比較 Word 文檔。

您可以從 下載部分 下載 JAR 文件,或者只獲取基於 maven 的 Java 應用程序的 pom.xml 的存儲庫和依賴項配置。

<repository>
	<id>GroupDocsJavaAPI</id>
	<name>GroupDocs Java API</name>
	<url>http://repository.groupdocs.com/repo/</url>
</repository>
<dependency>
        <groupId>com.groupdocs</groupId>
        <artifactId>groupdocs-comparison</artifactId>
        <version>22.3</version> 
</dependency>

在 Java 中比較 Word 文檔

您可以比較文檔的兩個版本以查找添加、刪除和更改的內容。結果,您將獲得一個顯示所有已識別更改的新文檔。以下是比較任意兩個 Word(DOC、DOCX)文檔並突出其差異的步驟。

  • 首先,使用 Comparer 類加載第一個 Word 文檔。
  • 然後,使用 add() 方法將第二個文件添加到 Comparer。
  • 最後,只需調用 compare() 方法即可比較並獲取更改摘要。

以下 Java 代碼顯示瞭如何比較 Word 文檔並在生成的文檔中獲取更改。

/*
 * 比較兩個 Word 文檔並突出顯示 Java 中的更改
 */
try (Comparer comparer = new Comparer("path/document-ver1.docx")) {
    comparer.add("path/document-ver2.docx");
    final Path resultPath = comparer.compare("path/compared-result.docx");
}

獲取免費的 API 許可證

您可以 獲得免費的臨時許可證 以不受評估限制地使用 API。

結論

綜上所述,我們學會了用Java比較兩個Word文檔(DOC/DOCX)的簡單方法。作為輸出,您獲得了插入或刪除內容的摘要。在另一篇文章中,我們將討論 比較受保護的 word 文檔接受或拒絕已識別的更改 的更多方法。

嘗試構建您自己的文檔比較 Java 應用程序。您可以使用 文檔API 參考 了解有關 API 的更多信息。

體驗示例的簡單方法來自 GitHub。如有任何疑問,請通過 論壇 聯繫我們。

也可以看看