Редагуйте документи Word на Java

DOC, DOCX і ODT є одними з найпоширеніших і широко використовуваних форматів файлів для обробки текстів. Microsoft Word і OpenOffice Writer підтримують ці формати та використовуються для написання документів. Тому, як розробнику, нам часто доводиться програмно редагувати документи Word у програмах. У цій статті ми обговоримо, як редагувати документи Word за допомогою Java API для редагування документів.

У цій статті розглядаються такі теми:

Java API для редагування та автоматизації документів Word

GroupDocs.Editor надає Java API для редагування документів і дозволяє розробникам завантажувати, редагувати та зберігати різні формати документів за допомогою редакторів WYSIWYG HTML. Окрім форматів текстових документів, API підтримує редагування електронних таблиць, презентацій, HTML, XML, TXT, CSV та багатьох інших форматів.

Завантажити або налаштувати

Ви можете завантажити файл JAR із розділу завантажень або просто отримати репозиторій і конфігурації залежностей для pom.xml ваших програм Java на основі maven.

<repository>
	<id>GroupDocsJavaAPI</id>
	<name>GroupDocs Java API</name>
	<url>http://repository.groupdocs.com/repo/</url>
</repository>
<dependency>
        <groupId>com.groupdocs</groupId>
        <artifactId>groupdocs-editor</artifactId>
        <version>20.11</version> 
</dependency>

Редагувати документи Word на Java

Після налаштування API можна швидко перейти до редагування документа Word. Наступні кроки дозволять вам редагувати текстові документи DOC/DOCX у Java.

  • Завантажте документ Word за допомогою Редактора.
  • Отримайте EditableDocument за допомогою методу edit.
  • Отримайте вбудований HTML завантаженого документа DOC/DOCX.
  • Відредагуйте вміст програмно або за допомогою будь-якого редактора WYSIWYG.
  • Перетворіть відредагований вміст назад на редагований документ.
  • Збережіть оновлений документ за допомогою відповідного методу зберегти.

Наведений нижче код Java дозволяє редагувати документи Word у програмі.

// Редагуйте документи Word DOC/DOCX у Java
Options.WordProcessingLoadOptions loadOptions = new WordProcessingLoadOptions();
loadOptions.setPassword("password-if-any");

Editor editor = new Editor("path/document.docx", loadOptions);
EditableDocument defaultWordProcessingDoc = editor.edit();

// Відредагуйте будь-який редактор WYSIWYG або програмно
String allEmbeddedInsideString = defaultWordProcessingDoc.getEmbeddedHtml();
String allEmbeddedInsideStringEdited = allEmbeddedInsideString.replace("document", "edited document");

// Збережіть відредагований документ
EditableDocument editedDoc = EditableDocument.fromMarkup(allEmbeddedInsideStringEdited, null);
WordProcessingSaveOptions saveOptions = new WordProcessingSaveOptions(WordProcessingFormats.Docx);
editor.save(editedDoc, "path/edited-document.docx", saveOptions);

Завантажити: ви можете застосувати додаткові параметри під час завантаження документа Word; наприклад надання пароля, якщо документ захищено.

Редагувати: після завантаження ви можете редагувати завантажений документ відповідно до ваших вимог. Наведений вище приклад замінює всі випадки слова «документ» на «відредагований документ» у документі Word.

Зберегти: під час збереження відредагованого документа ви можете встановити різні параметри. Ці варіанти включають: розбивка на сторінки, встановлення пароля, налаштування оптимізації пам’яті тощо.

Нижче наведено результат наведеного вище коду.

відредагований документ docx за допомогою API редактора

Вихідний документ – усі входження замінено

Висновок

Підводячи підсумок, ми навчилися редагувати документи Word на Java за допомогою Java API для редагування документів. Ви можете використовувати API разом із редакторами WYSIWYG для візуального редагування документів. Ви можете створити власну програму Java для редагування документів. Щоб отримати додаткові відомості, параметри та приклади, ви можете відвідати документацію і GitHub сховище. Щоб отримати додаткові запитання, зверніться до служби підтримки на форумі.

Дивись також