DOC und DOCX gehören zu den gängigsten Dokumentformaten, die zum Verfassen offizieller und persönlicher Dokumente verwendet werden. Wenn ein Dokument mehrmals geändert wird oder mehrere Versionen hat, können Sie zwei verschiedene Versionen dieses Dokuments einfach vergleichen. Für Sie als Java-Programmierer erläutert dieser Artikel die grundlegende Vorgehensweise zum Vergleichen zweier Word-Dokumente und zum Hervorheben der identifizierten Unterschiede in Java.

Vergleichen Sie Word-Dokumente, um Unterschiede in Java zu finden

Java-API zum Vergleichen von Word-Dokumenten

GroupDocs bietet Dokumenten- und Bildvergleichs-APIs für verschiedene Plattformen. Ich werde seine GroupDocs.Comparison for Java-APIs zum Vergleichen von Word-Dokumenten verwenden.

Sie können die JAR-Datei aus dem Download-Bereich herunterladen oder einfach die Repository- und Abhängigkeitskonfigurationen für die pom.xml Ihrer Maven-basierten Java-Anwendungen abrufen.

<repository>
	<id>GroupDocsJavaAPI</id>
	<name>GroupDocs Java API</name>
	<url>http://repository.groupdocs.com/repo/</url>
</repository>
<dependency>
        <groupId>com.groupdocs</groupId>
        <artifactId>groupdocs-comparison</artifactId>
        <version>22.3</version> 
</dependency>

Vergleichen Sie Word-Dokumente in Java

Sie können die beiden Versionen eines Dokuments vergleichen, um den hinzugefügten, gelöschten und geänderten Inhalt zu finden. Als Ergebnis erhalten Sie ein neues Dokument, das alle identifizierten Änderungen zeigt. Im Folgenden werden die Schritte beschrieben, um zwei beliebige Word-Dokumente (DOC, DOCX) zu vergleichen und ihre Unterschiede hervorzuheben.

  • Laden Sie zunächst das erste Word-Dokument mit der Klasse Comparer.
  • Fügen Sie dann die zweite Datei mit der Methode add() zum Vergleich hinzu.
  • Vergleichen Sie schließlich und erhalten Sie die Zusammenfassung der Änderungen, indem Sie einfach die Methode “compare()” aufrufen.

Der folgende Java-Code zeigt, wie Word-Dokumente verglichen und die Änderungen im resultierenden Dokument abgerufen werden.

/*
 * Vergleichen Sie zwei Word-Dokumente und markieren Sie Änderungen in Java
 */
try (Comparer comparer = new Comparer("path/document-ver1.docx")) {
    comparer.add("path/document-ver2.docx");
    final Path resultPath = comparer.compare("path/compared-result.docx");
}

Holen Sie sich eine kostenlose API-Lizenz

Sie können eine kostenlose temporäre Lizenz erhalten, um die API ohne die Evaluierungseinschränkungen zu verwenden.

Fazit

Zusammenfassend haben wir den einfachen Weg kennengelernt, zwei Word-Dokumente (DOC/DOCX) in Java zu vergleichen. Als Ausgabe erhalten Sie die Zusammenfassung der eingefügten oder gelöschten Inhalte. In einem separaten Artikel werden wir weitere Möglichkeiten zum Vergleich geschützter Word-Dokumente und Annehmen oder Ablehnen der identifizierten Änderungen besprechen.

Versuchen Sie, Ihre eigene Java-Anwendung zum Dokumentenvergleich zu erstellen. Weitere Informationen zu den APIs finden Sie in der Dokumentation und der API-Referenz.

Der einfache Weg, die Beispiele zu erleben, ist von GitHub. Kontaktieren Sie uns bei Fragen über das Forum.

Siehe auch