DOC и DOCX являются одними из наиболее распространенных форматов документов, используемых для составления официальных и личных документов. Если документ изменялся несколько раз или у него было несколько версий, вы можете легко сравнить две разные версии этого документа. Для вас, программиста Java, в этой статье обсуждается основной способ сравнения двух документов Word и выделение выявленных различий в Java.
Java API для сравнения документов Word
GroupDocs предоставляет API для сравнения документов и изображений для разных платформ. Я буду использовать его GroupDocs.Comparison for Java API для сравнения документов Word.
Вы можете скачать JAR-файл из раздела загрузок или просто получить репозиторий и конфигурации зависимостей для pom.xml ваших Java-приложений на основе maven.
<repository>
<id>GroupDocsJavaAPI</id>
<name>GroupDocs Java API</name>
<url>http://repository.groupdocs.com/repo/</url>
</repository>
<dependency>
<groupId>com.groupdocs</groupId>
<artifactId>groupdocs-comparison</artifactId>
<version>22.3</version>
</dependency>
Сравните документы Word в Java
Вы можете сравнить две версии документа, чтобы найти добавленное, удаленное и измененное содержимое. В результате вы получите новый документ, в котором указаны все выявленные изменения. Ниже приведены шаги для сравнения любых двух документов Word (DOC, DOCX) и выявления их различий.
- Во-первых, загрузите первый документ Word, используя класс Comparer.
- Затем добавьте второй файл в Comparer с помощью метода add().
- Наконец, сравните и получите сводку изменений, просто вызвав метод compare().
В следующем коде Java показано, как сравнивать документы Word и получать изменения в результирующем документе.
/*
* Сравните два документа Word и выделите изменения в Java
*/
try (Comparer comparer = new Comparer("path/document-ver1.docx")) {
comparer.add("path/document-ver2.docx");
final Path resultPath = comparer.compare("path/compared-result.docx");
}
Получите бесплатную лицензию API
Вы можете получить бесплатную временную лицензию для использования API без ограничений пробной версии.
Вывод
Подводя итог, мы научились простому способу сравнения двух документов Word (DOC/DOCX) в Java. На выходе вы получаете сводку вставленного или удаленного контента. В отдельной статье мы обсудим дополнительные способы сравнить защищенные текстовые документы и принять или отклонить выявленные изменения.
Попробуйте создать собственное Java-приложение для сравнения документов. Вы можете узнать больше об API, используя документацию и справочник по API.
Проще всего ознакомиться с примерами из GitHub. Свяжитесь с нами по любому вопросу через форум.