DOC и DOCX являются одними из наиболее распространенных форматов документов, используемых для составления официальных и личных документов. Если документ изменялся несколько раз или у него было несколько версий, вы можете легко сравнить две разные версии этого документа. Для вас, программиста Java, в этой статье обсуждается основной способ сравнения двух документов Word и выделение выявленных различий в Java.

Сравните документы Word, чтобы найти различия в Java

Java API для сравнения документов Word

GroupDocs предоставляет API для сравнения документов и изображений для разных платформ. Я буду использовать его GroupDocs.Comparison for Java API для сравнения документов Word.

Вы можете скачать JAR-файл из раздела загрузок или просто получить репозиторий и конфигурации зависимостей для pom.xml ваших Java-приложений на основе maven.

<repository>
	<id>GroupDocsJavaAPI</id>
	<name>GroupDocs Java API</name>
	<url>http://repository.groupdocs.com/repo/</url>
</repository>
<dependency>
        <groupId>com.groupdocs</groupId>
        <artifactId>groupdocs-comparison</artifactId>
        <version>22.3</version> 
</dependency>

Сравните документы Word в Java

Вы можете сравнить две версии документа, чтобы найти добавленное, удаленное и измененное содержимое. В результате вы получите новый документ, в котором указаны все выявленные изменения. Ниже приведены шаги для сравнения любых двух документов Word (DOC, DOCX) и выявления их различий.

  • Во-первых, загрузите первый документ Word, используя класс Comparer.
  • Затем добавьте второй файл в Comparer с помощью метода add().
  • Наконец, сравните и получите сводку изменений, просто вызвав метод compare().

В следующем коде Java показано, как сравнивать документы Word и получать изменения в результирующем документе.

/*
 * Сравните два документа Word и выделите изменения в Java
 */
try (Comparer comparer = new Comparer("path/document-ver1.docx")) {
    comparer.add("path/document-ver2.docx");
    final Path resultPath = comparer.compare("path/compared-result.docx");
}

Получите бесплатную лицензию API

Вы можете получить бесплатную временную лицензию для использования API без ограничений пробной версии.

Вывод

Подводя итог, мы научились простому способу сравнения двух документов Word (DOC/DOCX) в Java. На выходе вы получаете сводку вставленного или удаленного контента. В отдельной статье мы обсудим дополнительные способы сравнить защищенные текстовые документы и принять или отклонить выявленные изменения.

Попробуйте создать собственное Java-приложение для сравнения документов. Вы можете узнать больше об API, используя документацию и справочник по API.

Проще всего ознакомиться с примерами из GitHub. Свяжитесь с нами по любому вопросу через форум.

Смотрите также