PDF فرمت فایلی است که برای ارائه اسناد به روشی مستقل از نرم افزار کاربردی، سخت افزار و سیستم عامل مورد استفاده برای ایجاد یا مشاهده آنها استفاده می شود. با این حال، PDF ها به راحتی قابل ویرایش نیستند و برای صفحات وب مناسب نیستند. تبدیل PDF به HTML باعث می شود که محتوای سند به راحتی توسط موتورهای جستجو ویرایش، جستجو و نمایه شود و امکان مشاهده آسانتر سند در وب را فراهم می کند. در این مقاله یاد می گیریم که چگونه اسناد PDF را با استفاده از C# به فرمت PDF تبدیل کنیم.

تبدیل PDF به HTML در CSharp.

NET API برای تبدیل فایل های PDF به HTML

GroupDocs یک راه حل تبدیل سند برای توانمندسازی توسعه دهندگان با اتوماسیون ارائه می دهد. این برنامه به برنامه نویسان در تبدیل اسناد و فرمت های مختلف تصویر با .NET API کارآمد و قابل اعتماد خود کمک می کند. امروز، من از GroupDocs.Conversion for .NET API آن برای تبدیل اسناد PDF به فرمت HTML استفاده خواهم کرد.

می توانید نصب کننده DLL یا MSI را از بخش دانلودها دانلود کنید یا از طریق NuGet API را در برنامه .NET خود نصب کنید.

PM> Install-Package GroupDocs.Conversion

نحوه تبدیل PDF به HTML با استفاده از سی شارپ

بیایید با تبدیل اولیه یک فایل PDF به فرمت HTML با استفاده از C# شروع کنیم. مراحل زیر تمام صفحات یک فایل PDF را به HTML تبدیل می کند.

  • فایل PDF را با استفاده از کلاس Converter بارگیری کنید.
  • برای تبدیل سند بارگذاری شده به فرمت PDF، متد Convert را فراخوانی کنید.

کد C# زیر کل سند PDF را به HTML تبدیل می کند.

using GroupDocs.Conversion.Options.Convert;
...

// تبدیل PDF به HTML با استفاده از سی شارپ
using (var converter = new GroupDocs.Conversion.Converter("path/document.pdf"))
{
    var options = new WebConvertOptions();
    converter.Convert("path/converted-pdf-to.html", options);
}

تبدیل صفحات منتخب اسناد PDF محافظت شده با رمز عبور با استفاده از C#

همچنین می توانید اسناد PDF محافظت شده یا قفل شده را تبدیل کنید. مراحل زیر نحوه تبدیل صفحات انتخابی یک سند PDF قفل شده را به فرمت HTML با استفاده از C# نشان می دهد.

  • گزینه های بارگیری را با استفاده از کلاس PdfLoadOptions آماده کنید.
  • اکنون، فایل PDF را با استفاده از کلاس Converter بارگیری کنید.
  • با استفاده از کلاس WebConvertOptions گزینه های تبدیل را برای قالب HTML آماده کنید.
  • فهرستی از صفحات کاندید تبدیل را با استفاده از Pages، Page Number، PageCount، Zoom و سایر ویژگی ها تعریف کنید.
  • در نهایت، از روش Convert برای تبدیل فایل PDF بارگذاری شده به فرمت HTML استفاده کنید.

کد C# زیر صفحات انتخاب شده از سند PDF محافظت شده با رمز عبور را به HTML تبدیل می کند.

// تبدیل صفحات انتخابی PDF محافظت شده با رمز عبور به HTML با استفاده از C#

using GroupDocs.Conversion.Options.Convert;
using GroupDocs.Conversion.Options.Load;
...

Func<LoadOptions> getLoadOptions =() => new PdfLoadOptions
{
    Password = "file-password_123"
};

using (Converter converter = new Converter("path/protected-document.pdf", getLoadOptions))
{
    // گزینه های تبدیل را آماده کنید
    WebConvertOptions options = new WebConvertOptions
    {
        PageNumber = 2,
        FixedLayout = true,
        PagesCount = 1,
        FixedLayoutShowBorders = false
    };
    converter.Convert("path/converted-adv-pdf-to-.html", options);
}
خروجی PDF به HTML

نتیجه

برای نتیجه گیری مقاله، در مورد تبدیل PDF به HTML با استفاده از C# بحث کردیم. ما به طور جداگانه دو تبدیل مختلف را اجرا کردیم. ابتدا کل سند را با استفاده از گزینه های تبدیل پیش فرض تبدیل کردیم. علاوه بر این، ما صفحات انتخاب شده یک سند محافظت شده با رمز عبور را با استفاده از همان NET API به HTML تبدیل کردیم.

می‌توانید با استفاده از اسناد، مرجع API، یا با تجربه نمونه‌های GitHub درباره API اتوماسیون تبدیل .NET اطلاعات بیشتری کسب کنید. شما می توانید برای هر سوالی از طریق [فروم 5 با ما تماس بگیرید.

همچنین ببینید