PDF ist ein Dateiformat, das verwendet wird, um Dokumente auf eine Weise darzustellen, die unabhängig von der Anwendungssoftware, der Hardware und dem Betriebssystem ist, mit denen sie erstellt oder angezeigt werden. PDFs sind jedoch nicht einfach zu bearbeiten und eignen sich nicht gut für Webseiten. Durch das Konvertieren eines PDF-Dokuments in HTML kann der Inhalt des Dokuments von Suchmaschinen problemlos bearbeitet, durchsucht und indiziert werden, und das Dokument kann einfacher im Internet angezeigt werden. In diesem Artikel erfahren Sie, wie Sie PDF-Dokumente mit C# in das PDF-Format konvertieren.

Konvertieren Sie PDF in HTML in CSharp.

.NET-API zum Konvertieren von PDF-Dateien in HTML

GroupDocs bietet eine Dokumentenkonvertierungslösung, um Entwickler mit Automatisierung auszustatten. Es hilft Programmierern bei der Konvertierung verschiedener Dokumente und Bildformate mit seiner effizienten und zuverlässigen .NET-API. Heute werde ich die API GroupDocs.Conversion for .NET verwenden, um PDF-Dokumente in das HTML-Format zu konvertieren.

Sie können die DLLs oder das MSI-Installationsprogramm aus dem Download-Bereich herunterladen oder die API in Ihrer .NET-Anwendung über NuGet installieren.

PM> Install-Package GroupDocs.Conversion

So konvertieren Sie ein PDF mit C# in HTML

Beginnen wir mit der grundlegenden Konvertierung einer PDF-Datei in das HTML-Format mit C#. Die folgenden Schritte wandeln alle Seiten einer PDF-Datei in HTML um.

  • Laden Sie die PDF-Datei mit der Klasse Converter.
  • Rufen Sie die Convert-Methode auf, um das geladene Dokument in das PDF-Format umzuwandeln.

Der folgende C#-Code konvertiert das gesamte PDF-Dokument in HTML.

using GroupDocs.Conversion.Options.Convert;
...

// Konvertieren Sie PDF in HTML mit C#
using (var converter = new GroupDocs.Conversion.Converter("path/document.pdf"))
{
    var options = new WebConvertOptions();
    converter.Convert("path/converted-pdf-to.html", options);
}

Konvertieren Sie ausgewählte Seiten passwortgeschützter PDF-Dokumente mit C#

Sie können auch geschützte oder gesperrte PDF-Dokumente konvertieren. Die folgenden Schritte zeigen, wie Sie ausgewählte Seiten eines gesperrten PDF-Dokuments mithilfe von C# in das HTML-Format konvertieren.

  • Bereiten Sie die Ladeoptionen mit der Klasse PdfLoadOptions vor.
  • Laden Sie nun die PDF-Datei mit der Klasse Converter.
  • Bereiten Sie die Konvertierungsoptionen für das HTML-Format mithilfe der Klasse WebConvertOptions vor.
  • Definieren Sie die Liste der Konvertierungskandidatenseiten mithilfe von Pages, PageNumber, PageCount, Zoom und anderen Eigenschaften.
  • Verwenden Sie zuletzt die Convert-Methode, um die geladene PDF-Datei in das HTML-Format umzuwandeln.

Der folgende C#-Code konvertiert die ausgewählten Seiten des passwortgeschützten PDF-Dokuments in HTML.

// Konvertieren Sie ausgewählte Seiten passwortgeschützter PDF-Dateien mit C# in HTML

using GroupDocs.Conversion.Options.Convert;
using GroupDocs.Conversion.Options.Load;
...

Func<LoadOptions> getLoadOptions =() => new PdfLoadOptions
{
    Password = "file-password_123"
};

using (Converter converter = new Converter("path/protected-document.pdf", getLoadOptions))
{
    // Konversionsoptionen vorbereiten
    WebConvertOptions options = new WebConvertOptions
    {
        PageNumber = 2,
        FixedLayout = true,
        PagesCount = 1,
        FixedLayoutShowBorders = false
    };
    converter.Convert("path/converted-adv-pdf-to-.html", options);
}
PDF-zu-HTML-Ausgabe

Fazit

Zum Abschluss des Artikels haben wir die PDF-zu-HTML-Konvertierung mit C# besprochen. Wir haben separat zwei verschiedene Konvertierungen implementiert. Zuerst haben wir das gesamte Dokument mit den Standardkonvertierungsoptionen konvertiert. Darüber hinaus haben wir die ausgewählten Seiten eines passwortgeschützten Dokuments mit derselben .NET-API in HTML konvertiert.

Sie können mehr über die .NET-Konvertierungsautomatisierungs-API erfahren, indem Sie die Dokumentation, die API-Referenz oder die GitHub-Beispiele verwenden. Sie können uns für jede Frage über das Forum erreichen.

Siehe auch