PDF 是一種文件格式,用於以獨立於用於創建或查看它們的應用程序軟件、硬件和操作系統的方式呈現文檔。但是,PDF 不容易編輯,也不適合網頁。將 PDF 轉換為 HTML 可以讓搜索引擎輕鬆地編輯、搜索和索引文檔的內容,並且可以更輕鬆地在 Web 上查看文檔。在本文中,我們將學習如何使用 C# 將 PDF 文檔轉換為 PDF 格式。

在 CSharp 中將 PDF 轉換為 HTML。

.NET API 將 PDF 文件轉換為 HTML

GroupDocs 提供了一種文檔轉換解決方案,使開發人員能夠實現自動化。它通過其高效可靠的 .NET API 幫助程序員轉換各種文檔和圖像格式。今天,我將使用其 GroupDocs.Conversion for .NET API 將 PDF 文檔轉換為 HTML 格式。

您可以從 下載部分 下載 DLL 或 MSI 安裝程序,或通過 NuGet 在您的 .NET 應用程序中安裝 API。

PM> Install-Package GroupDocs.Conversion

如何使用 C# 將 PDF 轉換為 HTML

讓我們從使用 C# 將 PDF 文件基本轉換為 HTML 格式開始。以下步驟將 PDF 文件的所有頁面轉換為 HTML。

  • 使用 Converter 類加載 PDF 文件。
  • 調用 Convert 方法將加載的文檔轉換為 PDF 格式。

以下 C# 代碼將整個 PDF 文檔轉換為 HTML。

using GroupDocs.Conversion.Options.Convert;
...

// 使用 C# 將 PDF 轉換為 HTML
using (var converter = new GroupDocs.Conversion.Converter("path/document.pdf"))
{
    var options = new WebConvertOptions();
    converter.Convert("path/converted-pdf-to.html", options);
}

使用 C# 轉換受密碼保護的 PDF 文檔的選定頁面

您還可以轉換受保護或鎖定的 PDF 文檔。以下步驟顯示如何使用 C# 將鎖定的 PDF 文檔的選定頁面轉換為 HTML 格式。

  • 使用 PdfLoadOptions 類準備加載選項。
  • 現在,使用 Converter 類加載 PDF 文件。
  • 使用 WebConvertOptions 類為 HTML 格式準備轉換選項。
  • 使用 Pages、PageNumber、PageCount、Zoom 和其他屬性定義轉換候選頁面列表。
  • 最後,使用 Convert 方法將加載的 PDF 文件轉換為 HTML 格式。

以下 C# 代碼將受密碼保護的 PDF 文檔的選定頁面轉換為 HTML。

// 使用 C# 將受密碼保護的 PDF 的選定頁面轉換為 HTML

using GroupDocs.Conversion.Options.Convert;
using GroupDocs.Conversion.Options.Load;
...

Func<LoadOptions> getLoadOptions =() => new PdfLoadOptions
{
    Password = "file-password_123"
};

using (Converter converter = new Converter("path/protected-document.pdf", getLoadOptions))
{
    // 準備轉換選項
    WebConvertOptions options = new WebConvertOptions
    {
        PageNumber = 2,
        FixedLayout = true,
        PagesCount = 1,
        FixedLayoutShowBorders = false
    };
    converter.Convert("path/converted-adv-pdf-to-.html", options);
}
PDF 到 HTML 輸出

結論

在結束本文時,我們討論了使用 C# 將 PDF 轉換為 HTML。我們分別實現了兩種不同的轉換。首先,我們使用默認轉換選項轉換了整個文檔。此外,我們使用相同的 .NET API 將受密碼保護的文檔的選定頁面轉換為 HTML。

您可以使用 文檔API 參考 或體驗 GitHub 示例 來了解有關 .NET Conversion Automation API 的更多信息。您可以通過 論壇 聯繫我們進行任何查詢。

也可以看看