DOC, DOCX en ODT behoren tot de meest voorkomende en meest gebruikte bestandsindelingen voor tekstverwerking. Microsoft Word en OpenOffice Writer ondersteunen deze formaten en worden gebruikt voor het opstellen van documenten. Daarom moeten we als ontwikkelaar vaak Word-documenten programmatisch bewerken binnen de applicaties. In dit artikel bespreken we hoe u Word-documenten kunt bewerken met behulp van de Java API voor het bewerken van documenten.
In dit artikel komen de volgende onderwerpen aan bod:
Java API voor het bewerken en automatiseren van Word-documenten
GroupDocs.Editor biedt Java API voor het bewerken van documenten en stelt ontwikkelaars in staat om verschillende documentindelingen te laden, bewerken en opslaan met behulp van WYSIWYG HTML-editors. Naast de documentformaten voor tekstverwerking ondersteunt de API het bewerken van spreadsheets, presentaties, HTML, XML, TXT, CSV en vele andere formaten.
Downloaden of configureren
U kunt het JAR-bestand downloaden van de downloadsectie, of gewoon de repository- en afhankelijkheidsconfiguraties voor de pom.xml van uw maven-gebaseerde Java-applicaties ophalen.
<repository>
<id>GroupDocsJavaAPI</id>
<name>GroupDocs Java API</name>
<url>http://repository.groupdocs.com/repo/</url>
</repository>
<dependency>
<groupId>com.groupdocs</groupId>
<artifactId>groupdocs-editor</artifactId>
<version>20.11</version>
</dependency>
Bewerk Word-documenten in Java
Na het instellen van de API kunt u snel overgaan tot het bewerken van het Word-document. Met de volgende stappen kunt u de tekstverwerkingsdocumenten DOC/DOCX in Java bewerken.
- Laad het Word-document met Editor.
- Haal het EditableDocument op met de methode edit.
- Download de ingesloten HTML van het geladen DOC/DOCX-document.
- Bewerk de inhoud programmatisch of met behulp van een WYSIWYG-editor.
- Converteer de bewerkte inhoud terug naar een bewerkbaar document.
- Sla het bijgewerkte document op met de juiste methode opslaan.
Met de volgende Java-code kunt u Word-documenten in de toepassing bewerken.
// Bewerk de Word DOC/DOCX-documenten in Java
Options.WordProcessingLoadOptions loadOptions = new WordProcessingLoadOptions();
loadOptions.setPassword("password-if-any");
Editor editor = new Editor("path/document.docx", loadOptions);
EditableDocument defaultWordProcessingDoc = editor.edit();
// Bewerk met een willekeurige WYSIWYG-editor of bewerk programmatisch
String allEmbeddedInsideString = defaultWordProcessingDoc.getEmbeddedHtml();
String allEmbeddedInsideStringEdited = allEmbeddedInsideString.replace("document", "edited document");
// Sla het bewerkte document op
EditableDocument editedDoc = EditableDocument.fromMarkup(allEmbeddedInsideStringEdited, null);
WordProcessingSaveOptions saveOptions = new WordProcessingSaveOptions(WordProcessingFormats.Docx);
editor.save(editedDoc, "path/edited-document.docx", saveOptions);
Laden: u kunt extra opties toepassen tijdens het laden van het Word-document; zoals het verstrekken van het wachtwoord als het document is beveiligd.
Bewerken: na het laden kunt u het geladen document naar wens bewerken. Het bovenstaande voorbeeld vervangt alle keren dat het woord “document” voorkomt door het “bewerkte document” in een Word-document.
Opslaan: Tijdens het opslaan van het bewerkte document kunt u verschillende opties instellen. Deze opties omvatten; paginering, het instellen van een wachtwoord, instellingen voor geheugenoptimalisatie en meer.
Het volgende is de uitvoer van de bovenstaande code.
Conclusie
Kortom, we hebben geleerd om Word-documenten in Java te bewerken met behulp van de Java API voor het bewerken van documenten. U kunt de API samen met WYSIWYG-editors gebruiken om uw documenten visueel te bewerken. U kunt uw eigen Java-toepassing voor het bewerken van documenten bouwen. Voor meer details, opties en voorbeelden kun je de documentatie en de GitHub bezoeken opslagplaats. Neem voor verdere vragen contact op met de ondersteuning op het forum.