Bereinigung und Minimierung von HTML verbessern die Ladezeit und Bandbreitennutzung der Webseiten. Es wurde beobachtet, dass unnötiger Code eingeschleust wird, wenn ein Dokument mit einigen Tools in das HTML-Format konvertiert wird. Sie können diesen unerwünschten Code in Ihren .NET-Anwendungen entfernen. In diesem Artikel wird beschrieben, wie Word-Dokumente mithilfe von C# in minimiertes HTML gerendert werden.

Word mit C# als sauberes HTML rendern

.NET-API zum Rendern als minimiertes HTML

GroupDocs.Viewer bietet eine Dokumentanzeige-API, die es ermöglicht, verschiedene Dokumente in HTML zu rendern, PDF- und Bildformate innerhalb der .NET-Anwendung. Ich werde diese API in den Beispielen verwenden, um die DOCX-Datei in eine saubere HTML-Datei zu konvertieren.

Sie können die DLLs oder das MSI-Installationsprogramm aus dem Downloadbereich herunterladen oder die API in Ihrer .NET-Anwendung über NuGet.

PM> Install-Package GroupDocs.Viewer

Rendern Sie Word DOC/DOCX in minimiertes HTML mit C#

HTML-Dateien können entweder mit eingebetteten oder externen Ressourcen mit entsprechenden Methoden abgerufen werden. Die folgenden Schritte zeigen, wie Sie das Word-Dokument (DOC/DOCX) mithilfe von C# in minimiertes HTML konvertieren.

  • Laden Sie die DOCX-Datei mit der Klasse Viewer.
  • Bereiten Sie die HTML-Renderingoptionen mithilfe der Klasse HtmlViewOptions vor.
  • Aktivieren Sie die Minify-Option, indem Sie sie auf true setzen.
  • Verwenden Sie View() mit erstellten Optionen, um die DOCX-Datei als minimiertes HTML darzustellen.

Das folgende C#-Codebeispiel rendert die Word-DOCX-Datei in minimiertes HTML.

// Konvertieren Sie Word DOC/DOCX mit C# in minimiertes HTML
using (Viewer viewer = new Viewer("path/document.docx"))
{
    HtmlViewOptions options = HtmlViewOptions.ForEmbeddedResources("path/page_{0}.html");
    options.Minify = true;

    viewer.View(options);
}

Holen Sie sich eine kostenlose API-Lizenz

Sie können die APIs kostenlos ohne Evaluierungseinschränkungen verwenden, indem Sie eine temporäre Lizenz erwerben.

Fazit

Zusammenfassend haben wir besprochen, wie die DOC/DOCX-Dateien als minimiertes HTML mit C# gerendert werden. Sie können Ihren eigenen Online Converter und Cleaner erstellen, mit dem Benutzer die Dokumente in minimiertes HTML konvertieren können. Außerdem können Sie mehr über GroupDocs.Viewer for .NET in seiner Dokumentation erfahren. . Bei Fragen kontaktieren Sie uns über das Forum.

Siehe auch