تنسيق المستندات المحمولة (PDF) هو تنسيق مستند شائع ومستخدم على نطاق واسع تم تطويره بواسطة Adobe. يمكن أن تحتوي مستندات PDF على مجموعة متنوعة من المحتوى بما في ذلك النص المنسق والصور والتعليقات التوضيحية وحقول النموذج وما إلى ذلك. يعد تحليل مستند PDF برمجيًا حالة استخدام شائعة وهناك طرق متعددة لاستخراج النص. ومع ذلك ، فإن استخراج الصور من مستند PDF يعد مهمة معقدة. توضح هذه المقالة مدى سهولة استخراج الصور من مستندات PDF برمجيًا في C # باستخدام [GroupDocs.Parser for .NET] (https://products.groupdocs.com/parser) API. فلنبدأ.

خطوات لاستخراج الصور من مستند PDF

  1. إنشاء مشروع جديد.

  2. قم بتنزيل [GroupDocs.Parser for .NET] (https://downloads.groupdocs.com/parser/net) أو ثبته باستخدام [NuGet] (https://www.nuget.org/packages/GroupDocs.Parser) .

  3. أضف مساحات الأسماء التالية.

using GroupDocs.Parser;
using GroupDocs.Parser.Data;
using System.Drawing;
using System.Drawing.Imaging;
  1. قم بتحميل مستند PDF.
// إنشاء مثيل لفئة المحلل اللغوي
using (Parser parser = new Parser("sample.pdf"))
{
  // أنت تذهب هنا رمز.
}
  1. استخراج الصور من الوثيقة.
// استخراج الصور
IEnumerable<PageImageArea> images = parser.GetImages();
// تحقق مما إذا كان استخراج الصور مدعومًا
if (images == null)
{
  Console.WriteLine("Images extraction isn't supported");
  return;
}
  1. الوصول إلى كل صورة من المجموعة وحفظها.
// كرر على الصور
foreach (PageImageArea image in images)
{
  // حفظ الصور
  Image.FromStream(image.GetImageStream()).Save(string.Format("{0}.Jpeg", counter++), ImageFormat.Jpeg);                    
}

كود كامل

// إنشاء مثيل لفئة المحلل اللغوي
using (Parser parser = new Parser("C:\\candy.pdf"))
{
	// استخراج الصور
	IEnumerable<PageImageArea> images = parser.GetImages();
	// تحقق مما إذا كان استخراج الصورة مدعومًا
	if (images == null)
	{
		Console.WriteLine("Images extraction isn't supported");
		return;
	}
	
	int counter = 1;
	// كرر على الصور
	foreach (PageImageArea image in images)
	{
		// احفظ كل صورة
		Image.FromStream(image.GetImageStream()).Save(string.Format("{0}.Jpeg", counter++), ImageFormat.Jpeg);                    
	}
}

نتائج

وثيقة PDF

وثيقة PDF لاستخراج الصور.

الصور المستخرجة

الصور المستخرجة من ملف PDF.

للحصول على قائمة كاملة بالميزات التي يوفرها GroupDocs.Parser لـ .NET API ، تفضل بزيارة [الوثائق] (https://docs.groupdocs.com/display/parsernet/Features+Overview). هتافات!