DOC および DOCX は、公式文書および個人文書の起草に使用される最も一般的な文書形式です。ドキュメントが何度か変更された場合、または複数のバージョンがある場合、そのドキュメントの 2 つの異なるバージョンを簡単に比較できます。この記事では、Java プログラマーとして、2 つの Word 文書を比較する基本的な方法と、Java で特定された相違点を強調する方法について説明します。

Word 文書を比較して Java の違いを見つける

Word文書を比較するためのJava API

GroupDocs は、さまざまなプラットフォーム用のドキュメントと画像の比較 API を提供します。 GroupDocs.Comparison for Java API を使用して、Word ドキュメントを比較します。

ダウンロード セクション から JAR ファイルをダウンロードするか、Maven ベースの Java アプリケーションの pom.xml のリポジトリと依存関係の構成を取得します。

<repository>
	<id>GroupDocsJavaAPI</id>
	<name>GroupDocs Java API</name>
	<url>http://repository.groupdocs.com/repo/</url>
</repository>
<dependency>
        <groupId>com.groupdocs</groupId>
        <artifactId>groupdocs-comparison</artifactId>
        <version>22.3</version> 
</dependency>

Java で Word 文書を比較する

ドキュメントの 2 つのバージョンを比較して、追加、削除、および変更されたコンテンツを見つけることができます。その結果、識別されたすべての変更を示す新しいドキュメントが得られます。以下は、任意の 2 つの Word (DOC、DOCX) ドキュメントを比較し、それらの違いを強調する手順です。

  • まず、Comparer クラスを使用して最初の Word ドキュメントを読み込みます。
  • 次に、add() メソッドを使用して 2 番目のファイルを Comparer に追加します。
  • 最後に、compare() メソッドを呼び出すだけで、変更の概要を比較して取得します。

次の Java コードは、Word ドキュメントを比較し、結果のドキュメントの変更を取得する方法を示しています。

/*
 * 2 つの Word 文書を比較し、Java での変更点を強調表示する
 */
try (Comparer comparer = new Comparer("path/document-ver1.docx")) {
    comparer.add("path/document-ver2.docx");
    final Path resultPath = comparer.compare("path/compared-result.docx");
}

無料の API ライセンスを取得する

無料の一時ライセンスを取得して、評価制限なしで API を使用できます。

結論

要約すると、Java で 2 つの Word ドキュメント (DOC/DOCX) を比較する簡単な方法を学びました。出力として、挿入または削除されたコンテンツの概要が得られました。別の記事で、保護された Word 文書を比較するおよび特定された変更を受け入れるか拒否するためのさらなる方法について説明します。

独自の文書比較 Java アプリケーションを作成してみてください。 ドキュメントAPI リファレンス を使用して、API について詳しく知ることができます。

サンプルを体験する簡単な方法は、GitHub からです。 フォーラム からお問い合わせください。

関連項目