Die HTML-Minifizierung verbessert die Leistung der Webanwendung mit effizienter Ladezeit und Bandbreitennutzung. Unnötige Codeteile, unbedeutende Whitespaces, Kommentare, Semikolons, Farbwerte im HTML und CSS werden im Minifizierungsprozess optimiert. Lassen Sie uns den Prozess automatisieren, um den unerwünschten Code loszuwerden und die Effizienz Ihrer Java-Anwendungen zu verbessern. Um die Leistung zu verbessern, behandelt dieser Artikel wie Word-Dokumente in Java in minimiertem HTML gerendert werden.

Rendern Sie Word-Dokumente als sauberes HTML in Java

Java-API zum Rendern als minimiertes HTML

GroupDocs.Viewer präsentiert eine API zum Anzeigen von Dokumenten, die das Rendern verschiedener Arten von Dokumenten ermöglicht HTML-, PDF- und Bildformate in Java-Anwendungen. Ich werde diese API im Beispiel verwenden, um die Microsoft Word DOCX-Datei in eine saubere HTML-Datei zu konvertieren.

Sie können die JAR-Datei aus dem Download-Bereich herunterladen oder die neuesten Repository- und Abhängigkeitskonfigurationen Maven in Ihren Java-Anwendungen verwenden.

<repository>
	<id>GroupDocsArtifactRepository</id>
	<name>GroupDocs Artifact Repository</name>
	<url>https://repository.groupdocs.com/repo/</url>
</repository>

<dependency>
        <groupId>com.groupdocs</groupId>
        <artifactId>groupdocs-viewer</artifactId>
        <version>21.11.1</version> 
</dependency>

Rendern Sie Word DOC/DOCX in minimiertes HTML in Java

HTML-Dateien können entweder mit eingebetteten oder externen Ressourcen unter Verwendung entsprechender Methoden erzeugt werden. Die folgenden Schritte zeigen, wie das Word-Dokument (DOC/DOCX) in Java in minimiertes HTML gerendert wird.

  • Laden Sie die DOCX-Datei mit der Klasse Viewer.
  • Bereiten Sie die HTML-Renderingoptionen mithilfe der Klasse HtmlViewOptions vor.
  • Aktivieren Sie die Minimierungsoption, indem Sie sie auf „true“ setzen.
  • Verwenden Sie view() mit den erstellten Optionen, um die DOCX-Datei als minimiertes HTML darzustellen.

Das folgende Java-Codebeispiel rendert die Word-DOCX-Datei in minimiertes HTML.

// Konvertieren Sie Word DOC/DOCX in minimiertes HTML in Java
Viewer viewer = new Viewer("path/document.docx");

HtmlViewOptions viewOptions = HtmlViewOptions.forEmbeddedResources("path/page_{0}.html");
viewOptions.setMinify(true);

viewer.view(viewOptions);

Holen Sie sich eine kostenlose API-Lizenz

Sie können die APIs kostenlos ohne Evaluierungseinschränkungen verwenden, indem Sie eine temporäre Lizenz erwerben.

Fazit

Abschließend wurde in diesem Artikel erläutert, wie die DOC/DOCX-Dateien als minimiertes HTML in Java gerendert werden. Sie können Ihren eigenen Online-Dokumentkonverter und HTML-Minifier entwickeln, mit denen Benutzer die Dokumente in minimiertes HTML konvertieren können. Außerdem können Sie mehr über GroupDocs.Viewer for Java in seiner Dokumentation erfahren. Bei Fragen kontaktieren Sie uns über das Forum.

Siehe auch