Upravte dokumenty Word v Java

DOC, DOCX a ODT patří mezi nejběžnější a široce používané formáty souborů pro zpracování textu. Microsoft Word a OpenOffice Writer podporují tyto formáty a používají se pro kreslení dokumentů. Proto jako vývojáři často potřebujeme programově upravovat dokumenty Wordu v rámci aplikací. V tomto článku se budeme zabývat tím, jak upravovat dokumenty aplikace Word pomocí rozhraní Java API pro úpravy dokumentů.

V tomto článku jsou popsána následující témata:

Java API pro úpravu a automatizaci dokumentů aplikace Word

GroupDocs.Editor poskytuje Java API pro úpravy dokumentů a umožňuje vývojářům načítat, upravovat a ukládat různé formáty dokumentů pomocí WYSIWYG HTML editorů. Kromě formátů dokumentů pro zpracování textu rozhraní API podporuje úpravy tabulek, prezentací, HTML, XML, TXT, CSV a mnoha dalších formátů.

Stáhnout nebo Konfigurovat

Soubor JAR si můžete stáhnout z části ke stažení, nebo si stačí stáhnout konfigurace úložiště a závislostí pro pom.xml vašich Java aplikací založených na maven.

<repository>
	<id>GroupDocsJavaAPI</id>
	<name>GroupDocs Java API</name>
	<url>http://repository.groupdocs.com/repo/</url>
</repository>
<dependency>
        <groupId>com.groupdocs</groupId>
        <artifactId>groupdocs-editor</artifactId>
        <version>20.11</version> 
</dependency>

Upravujte dokumenty Word v Java

Po nastavení rozhraní API můžete rychle přejít k úpravám dokumentu aplikace Word. Následující kroky vám umožní upravovat dokumenty pro zpracování textu DOC/DOCX v Java.

  • Načtěte dokument Word pomocí Editor.
  • Načtěte EditableDocument pomocí metody edit.
  • Získejte vložený HTML načteného dokumentu DOC/DOCX.
  • Upravte obsah programově nebo pomocí libovolného WYSIWYG editoru.
  • Převeďte upravený obsah zpět na upravitelný dokument.
  • Uložte aktualizovaný dokument pomocí příslušné metody save.

Následující kód Java umožňuje úpravy dokumentů aplikace Word v rámci aplikace.

// Upravte dokumenty Word DOC/DOCX v Java
Options.WordProcessingLoadOptions loadOptions = new WordProcessingLoadOptions();
loadOptions.setPassword("password-if-any");

Editor editor = new Editor("path/document.docx", loadOptions);
EditableDocument defaultWordProcessingDoc = editor.edit();

// Buď upravujte pomocí libovolného WYSIWYG editoru nebo upravujte programově
String allEmbeddedInsideString = defaultWordProcessingDoc.getEmbeddedHtml();
String allEmbeddedInsideStringEdited = allEmbeddedInsideString.replace("document", "edited document");

// Upravený dokument uložte
EditableDocument editedDoc = EditableDocument.fromMarkup(allEmbeddedInsideStringEdited, null);
WordProcessingSaveOptions saveOptions = new WordProcessingSaveOptions(WordProcessingFormats.Docx);
editor.save(editedDoc, "path/edited-document.docx", saveOptions);

Načíst: Při načítání dokumentu aplikace Word můžete použít další možnosti; jako poskytnutí hesla, pokud je dokument chráněn.

Upravit: Po načtení můžete načtený dokument upravit podle svých požadavků. Výše uvedený příklad nahrazuje všechny výskyty slova „dokument“ výrazem „upravený dokument“ v dokumentu aplikace Word.

Uložit: Při ukládání upraveného dokumentu můžete nastavit různé možnosti. Tyto možnosti zahrnují; stránkování, nastavení hesla, nastavení optimalizace paměti a další.

Následuje výstup výše uvedeného kódu.

upravený dokument docx pomocí editoru API

Výstupní dokument - Všechny výskyty jsou nahrazeny

Závěr

Abych to shrnul, naučili jsme se upravovat dokumenty Wordu v Java pomocí Java API pro úpravu dokumentů. K vizuální úpravě dokumentů můžete použít API spolu s editory WYSIWYG. Můžete si vytvořit vlastní Java aplikaci pro úpravu dokumentů. Další podrobnosti, možnosti a příklady naleznete v dokumentaci a GitHub úložiště. Pro další dotazy kontaktujte podporu na fóru.

Viz také