PDF 是一種文件格式,用於以獨立於用於創建或查看它們的應用程序軟件、硬件和操作系統的方式呈現文檔。但是,PDF 不容易編輯,也不適合網頁。將 PDF 轉換為 HTML 可以讓搜索引擎輕鬆地編輯、搜索和索引文檔的內容,並且可以更輕鬆地在 Web 上查看文檔。在本文中,我們將學習如何使用 C# 將 PDF 文檔轉換為 PDF 格式。
.NET API 將 PDF 文件轉換為 HTML
GroupDocs 提供了一種文檔轉換解決方案,使開發人員能夠實現自動化。它通過其高效可靠的 .NET API 幫助程序員轉換各種文檔和圖像格式。今天,我將使用其 GroupDocs.Conversion for .NET API 將 PDF 文檔轉換為 HTML 格式。
您可以從 下載部分 下載 DLL 或 MSI 安裝程序,或通過 NuGet 在您的 .NET 應用程序中安裝 API。
PM> Install-Package GroupDocs.Conversion
如何使用 C# 將 PDF 轉換為 HTML
讓我們從使用 C# 將 PDF 文件基本轉換為 HTML 格式開始。以下步驟將 PDF 文件的所有頁面轉換為 HTML。
- 使用 Converter 類加載 PDF 文件。
- 調用 Convert 方法將加載的文檔轉換為 PDF 格式。
以下 C# 代碼將整個 PDF 文檔轉換為 HTML。
using GroupDocs.Conversion.Options.Convert;
...
// 使用 C# 將 PDF 轉換為 HTML
using (var converter = new GroupDocs.Conversion.Converter("path/document.pdf"))
{
var options = new WebConvertOptions();
converter.Convert("path/converted-pdf-to.html", options);
}
使用 C# 轉換受密碼保護的 PDF 文檔的選定頁面
您還可以轉換受保護或鎖定的 PDF 文檔。以下步驟顯示如何使用 C# 將鎖定的 PDF 文檔的選定頁面轉換為 HTML 格式。
- 使用 PdfLoadOptions 類準備加載選項。
- 現在,使用 Converter 類加載 PDF 文件。
- 使用 WebConvertOptions 類為 HTML 格式準備轉換選項。
- 使用 Pages、PageNumber、PageCount、Zoom 和其他屬性定義轉換候選頁面列表。
- 最後,使用 Convert 方法將加載的 PDF 文件轉換為 HTML 格式。
以下 C# 代碼將受密碼保護的 PDF 文檔的選定頁面轉換為 HTML。
// 使用 C# 將受密碼保護的 PDF 的選定頁面轉換為 HTML
using GroupDocs.Conversion.Options.Convert;
using GroupDocs.Conversion.Options.Load;
...
Func<LoadOptions> getLoadOptions =() => new PdfLoadOptions
{
Password = "file-password_123"
};
using (Converter converter = new Converter("path/protected-document.pdf", getLoadOptions))
{
// 準備轉換選項
WebConvertOptions options = new WebConvertOptions
{
PageNumber = 2,
FixedLayout = true,
PagesCount = 1,
FixedLayoutShowBorders = false
};
converter.Convert("path/converted-adv-pdf-to-.html", options);
}
結論
在結束本文時,我們討論了使用 C# 將 PDF 轉換為 HTML。我們分別實現了兩種不同的轉換。首先,我們使用默認轉換選項轉換了整個文檔。此外,我們使用相同的 .NET API 將受密碼保護的文檔的選定頁面轉換為 HTML。
您可以使用 文檔、API 參考 或體驗 GitHub 示例 來了解有關 .NET Conversion Automation API 的更多信息。您可以通過 論壇 聯繫我們進行任何查詢。