PDF هو تنسيق ملف يتم استخدامه لتقديم المستندات بطريقة مستقلة عن البرامج التطبيقية والأجهزة ونظام التشغيل المستخدم في إنشائها أو عرضها. ومع ذلك ، فإن ملفات PDF ليست قابلة للتحرير بسهولة وليست مناسبة تمامًا لصفحات الويب. يسمح تحويل ملف PDF إلى HTML بتحرير محتوى المستند والبحث فيه وفهرسته بسهولة بواسطة محركات البحث ، ويسمح بعرض المستند بسهولة أكبر على الويب. في هذه المقالة ، سوف نتعلم كيفية تحويل مستندات PDF إلى تنسيق PDF باستخدام C#.

تحويل PDF إلى HTML في CSharp.

NET API لتحويل ملفات PDF إلى HTML

يوفر GroupDocs حلاً لتحويل المستندات لتمكين المطورين من التشغيل الآلي. يساعد المبرمجين في تحويل العديد من المستندات وتنسيقات الصور باستخدام .NET API الفعال والموثوق. اليوم ، سأستخدم GroupDocs.Conversion for .NET API لتحويل مستندات PDF إلى تنسيق HTML.

يمكنك تنزيل مثبت DLL أو MSI من قسم التنزيلات أو تثبيت API في تطبيق .NET عبر NuGet.

PM> Install-Package GroupDocs.Conversion

كيفية تحويل ملف PDF إلى HTML باستخدام C#

لنبدأ بالتحويل الأساسي لملف PDF إلى تنسيق HTML باستخدام C#. تحول الخطوات التالية جميع صفحات ملف PDF إلى HTML.

  • قم بتحميل ملف PDF باستخدام فئة المحول.
  • قم باستدعاء طريقة التحويل لتحويل المستند الذي تم تحميله إلى تنسيق PDF.

يحول كود C# التالي مستند PDF بأكمله إلى HTML.

using GroupDocs.Conversion.Options.Convert;
...

// تحويل PDF إلى HTML باستخدام C#
using (var converter = new GroupDocs.Conversion.Converter("path/document.pdf"))
{
    var options = new WebConvertOptions();
    converter.Convert("path/converted-pdf-to.html", options);
}

تحويل الصفحات المحددة من مستندات PDF المحمية بكلمة مرور باستخدام C#

يمكنك أيضًا تحويل مستندات PDF المحمية أو المؤمنة. توضح الخطوات التالية كيفية تحويل الصفحات الانتقائية لمستند PDF مقفل إلى تنسيق HTML باستخدام C#.

  • قم بإعداد خيارات التحميل باستخدام فئة PdfLoadOptions.
  • الآن ، قم بتحميل ملف PDF باستخدام فئة المحول.
  • قم بإعداد خيارات التحويل لتنسيق HTML باستخدام فئة WebConvertOptions.
  • حدد قائمة الصفحات المرشحة للتحويل باستخدام Pages و PageNumber و PageCount و Zoom وخصائص أخرى.
  • أخيرًا ، استخدم طريقة التحويل لتحويل ملف PDF المحمل إلى تنسيق HTML.

يحول رمز C# التالي الصفحات المحددة من مستند PDF المحمي بكلمة مرور إلى HTML.

// تحويل الصفحات المحددة من PDF المحمي بكلمة مرور إلى HTML باستخدام C#

using GroupDocs.Conversion.Options.Convert;
using GroupDocs.Conversion.Options.Load;
...

Func<LoadOptions> getLoadOptions =() => new PdfLoadOptions
{
    Password = "file-password_123"
};

using (Converter converter = new Converter("path/protected-document.pdf", getLoadOptions))
{
    // تحضير خيارات التحويل
    WebConvertOptions options = new WebConvertOptions
    {
        PageNumber = 2,
        FixedLayout = true,
        PagesCount = 1,
        FixedLayoutShowBorders = false
    };
    converter.Convert("path/converted-adv-pdf-to-.html", options);
}
إخراج PDF إلى HTML

استنتاج

لاختتام المقالة ، ناقشنا تحويل PDF إلى HTML باستخدام C#. قمنا بتنفيذ تحويلين مختلفين بشكل منفصل. أولاً ، قمنا بتحويل المستند بأكمله باستخدام خيارات التحويل الافتراضية. علاوة على ذلك ، قمنا بتحويل الصفحات المحددة من مستند محمي بكلمة مرور إلى HTML باستخدام نفس .NET API.

يمكنك معرفة المزيد حول .NET Conversion Automation API باستخدام التوثيق ، مرجع API ، أو من خلال تجربة أمثلة GitHub. يمكنك الوصول إلينا لأي استفسار عبر المنتدى.

أنظر أيضا