Editar documentos do Word em Java

DOC, DOCX e ODT estão entre os formatos de arquivo de processamento de texto mais comuns e amplamente usados. O Microsoft Word e o OpenOffice Writer suportam esses formatos e são usados para redigir documentos. Portanto, como desenvolvedor, muitas vezes precisamos editar documentos do Word programaticamente dentro dos aplicativos. Neste artigo, discutiremos como editar documentos do Word usando a API Java para edição de documentos.

Os seguintes tópicos são abordados neste artigo:

API Java para edição e automação de documentos do Word

GroupDocs.Editor fornece API Java para edição de documentos e permite que os desenvolvedores carreguem, editem e salvem vários formatos de documentos usando editores HTML WYSIWYG. Além dos formatos de documentos de processamento de texto, a API suporta a edição de planilhas, apresentações, HTML, XML, TXT, CSV e muitos outros formatos.

Baixe ou configure

Você pode baixar o arquivo JAR da seção de downloads, ou apenas obter as configurações de repositório e dependência para o pom.xml do seu **maven-based **Aplicativos Java.

<repository>
	<id>GroupDocsJavaAPI</id>
	<name>GroupDocs Java API</name>
	<url>http://repository.groupdocs.com/repo/</url>
</repository>
<dependency>
        <groupId>com.groupdocs</groupId>
        <artifactId>groupdocs-editor</artifactId>
        <version>20.11</version> 
</dependency>

Editar documentos do Word em Java

Depois de configurar a API, você pode avançar rapidamente para a edição do documento do Word. As etapas a seguir permitem editar os documentos de processamento de texto DOC/DOCX em Java.

  • Carregue o documento do Word usando Editor.
  • Busque o EditableDocument usando o método edit.
  • Obtenha o HTML incorporado do documento DOC/DOCX carregado.
  • Edite o conteúdo programaticamente ou usando qualquer editor WYSIWYG.
  • Converta o conteúdo editado de volta para um documento editável.
  • Salve o documento atualizado usando o método apropriado save.

O código Java a seguir permite editar documentos do Word dentro do aplicativo.

// Edite os documentos Word DOC/DOCX em Java
Options.WordProcessingLoadOptions loadOptions = new WordProcessingLoadOptions();
loadOptions.setPassword("password-if-any");

Editor editor = new Editor("path/document.docx", loadOptions);
EditableDocument defaultWordProcessingDoc = editor.edit();

// Edite usando qualquer editor WYSIWYG ou edite programaticamente
String allEmbeddedInsideString = defaultWordProcessingDoc.getEmbeddedHtml();
String allEmbeddedInsideStringEdited = allEmbeddedInsideString.replace("document", "edited document");

// Salve o documento editado
EditableDocument editedDoc = EditableDocument.fromMarkup(allEmbeddedInsideStringEdited, null);
WordProcessingSaveOptions saveOptions = new WordProcessingSaveOptions(WordProcessingFormats.Docx);
editor.save(editedDoc, "path/edited-document.docx", saveOptions);

Carregar: você pode aplicar opções adicionais ao carregar o documento do Word; como fornecer a senha se o documento estiver protegido.

Editar: após o carregamento, você pode editar o documento carregado conforme sua necessidade. O exemplo acima substitui todas as ocorrências da palavra “documento” pelo “documento editado” em um documento do Word.

Salvar: ao salvar o documento editado, você pode definir diferentes opções. Essas opções incluem; paginação, definir uma senha, configurações de otimização de memória e muito mais.

A seguir está a saída do código acima.

documento docx editado usando a API do editor

Documento de saída - Todas as ocorrências são substituídas

Conclusão

Para resumir, aprendemos a editar documentos do Word em Java usando a API Java de edição de documentos. Você pode usar a API junto com os editores WYSIWYG para editar visualmente seus documentos. Você pode construir seu próprio aplicativo Java de edição de documentos. Para mais detalhes, opções e exemplos, você pode visitar a documentação e o GitHub repositório. Para mais dúvidas, entre em contato com o suporte no fórum.

Veja também