DOC 和 DOCX 是用於起草官方和個人文件的最常見的文件格式。如果一個文檔被多次更改或者它有多個版本,您可以輕鬆地比較該文檔的兩個不同版本。對於作為 Java 程序員的您,本文討論瞭如何比較兩個 Word 文檔以及如何在 Java 中突出顯示已識別差異的基本方法。
用於比較 Word 文檔的 Java API
GroupDocs 提供了針對不同平台的文檔和圖像比較 API。我將使用其 GroupDocs.Comparison for Java API 來比較 Word 文檔。
您可以從 下載部分 下載 JAR 文件,或者只獲取基於 maven 的 Java 應用程序的 pom.xml 的存儲庫和依賴項配置。
<repository>
<id>GroupDocsJavaAPI</id>
<name>GroupDocs Java API</name>
<url>http://repository.groupdocs.com/repo/</url>
</repository>
<dependency>
<groupId>com.groupdocs</groupId>
<artifactId>groupdocs-comparison</artifactId>
<version>22.3</version>
</dependency>
在 Java 中比較 Word 文檔
您可以比較文檔的兩個版本以查找添加、刪除和更改的內容。結果,您將獲得一個顯示所有已識別更改的新文檔。以下是比較任意兩個 Word(DOC、DOCX)文檔並突出其差異的步驟。
- 首先,使用 Comparer 類加載第一個 Word 文檔。
- 然後,使用 add() 方法將第二個文件添加到 Comparer。
- 最後,只需調用 compare() 方法即可比較並獲取更改摘要。
以下 Java 代碼顯示瞭如何比較 Word 文檔並在生成的文檔中獲取更改。
/*
* 比較兩個 Word 文檔並突出顯示 Java 中的更改
*/
try (Comparer comparer = new Comparer("path/document-ver1.docx")) {
comparer.add("path/document-ver2.docx");
final Path resultPath = comparer.compare("path/compared-result.docx");
}
獲取免費的 API 許可證
您可以 獲得免費的臨時許可證 以不受評估限制地使用 API。
結論
綜上所述,我們學會了用Java比較兩個Word文檔(DOC/DOCX)的簡單方法。作為輸出,您獲得了插入或刪除內容的摘要。在另一篇文章中,我們將討論 比較受保護的 word 文檔 和 接受或拒絕已識別的更改 的更多方法。
嘗試構建您自己的文檔比較 Java 應用程序。您可以使用 文檔 和 API 參考 了解有關 API 的更多信息。
體驗示例的簡單方法來自 GitHub。如有任何疑問,請通過 論壇 聯繫我們。