الكتب الإلكترونية ذات التنسيقات المختلفة شائعة جدًا في الاستخدام اليومي. يمكن أن يحتوي الكتاب الإلكتروني على نص بالإضافة إلى صور. إذا كنت ترغب في استخدام صور أي كتاب إلكتروني في مكان آخر ، فيمكنك الحصول على هذه الصور المستخرجة بسهولة برمجيًا داخل تطبيق Java الخاص بك. في هذه المقالة ، ستتعلم أتمتة كيفية استخراج الصور من ملفات الكتب الإلكترونية مثل EPUB و PDF و FB2 و CHM في Java.

سيتم تناول الموضوعات التالية أدناه:

Java API لاستخراج الصور من الكتب الإلكترونية

GroupDocs.Parser for Java API هي واجهة برمجة تطبيقات أتمتة غنية بالميزات لاستخراج الصور من الكتب الإلكترونية والمستندات في Java. بالإضافة إلى ذلك ، تدعم واجهة برمجة التطبيقات التحليل واستخراج الصور والنصوص والبيانات الوصفية من مستندات معالجة الكلمات وجداول البيانات و PDF والعروض التقديمية ورسائل البريد الإلكتروني وأرشيفات ZIP والعديد من تنسيقات المستندات المدعومة.

التنزيل والتكوين

احصل على ملف JAR من قسم التنزيلات ، أو أضف تكوين pom.xml التالي في تطبيقات Java المستندة إلى Maven لتجربة الأمثلة المذكورة أدناه. للحصول على التفاصيل ، يمكنك زيارة مرجع API.

<repository>
	<id>GroupDocsJavaAPI</id>
	<name>GroupDocs Java API</name>
	<url>http://repository.groupdocs.com/repo/</url>
</repository>
<dependency>
	<groupId>com.groupdocs</groupId>
	<artifactId>groupdocs-parser</artifactId>
	<version>21.2</version> 
</dependency>

استخراج الصور من EPUB eBook في Java

لنبدأ بالكتاب الإلكتروني EPUB لتحليله للصور. تعمل الخطوات التالية على تحليل كتاب EPUB الإلكتروني واستخراج جميع الصور منه باستخدام كود Java.

  • إنشاء محلل كائن فئة مع الكتاب الإلكتروني.
  • استخدم طريقة getImages لاستخراج جميع صور الكتاب الإلكتروني EPUB.
  • اجتياز الصور المستخرجة وحفظها على القرص.
الكتاب الإلكتروني EPUB بالصور

كتاب إلكتروني EPUB من Adobe [نموذج لمكتبة الكتب الإلكترونية][11]

تحلل شفرة Java التالية كتاب EPUB الإلكتروني وتحفظ صور الكتاب الإلكتروني واحدة تلو الأخرى على القرص.

// تحليل الكتب الإلكترونية لاستخراج الصور من ملفات PDF و EPUB و FB2 و CHM في Java وحفظها على القرص.
Parser parser = new Parser("ebook.epub");
// استخراج الصور من الكتاب الإلكتروني وحفظها بتنسيق JPEG.
Iterable<PageImageArea> images = parser.getImages();
ImageOptions options = new ImageOptions(ImageFormat.Jpeg);
int imageNumber = 0;
// كرر الصور المستخرجة
for (PageImageArea image : images) {
    image.save(Constants.getOutputFilePath(String.format("%d.jpeg", imageNumber)), options);
    imageNumber++;
}
صورة مستخرجة من EPUB eBook

نتيجة لذلك ، سيتم حفظ جميع الصور في الموقع المحدد. هذه واحدة من الصور المعروضة كعينة.

يمكن حفظ الصور بأي من تنسيقات ملفات الصور التالية:

  • JPG
  • بي إن جي
  • ويب
  • GIF
  • BMP

استخراج الصور من الكتب الإلكترونية بتنسيق PDF و FB2 و CHM بجافا

بالإضافة إلى تنسيق EPUB ، إذا كان لديك كتاب إلكتروني بتنسيق PDF أو FB2 أو CHM أو بتنسيق آخر ، فيمكنك استخراج صورهم بنفس الطريقة. ما عليك سوى تمرير كتابك الإلكتروني إلى مُنشئ المحلل اللغوي أثناء إنشاء الكائن. بعد ذلك ، ستقوم طريقة getImages باستخراج الصور من كتبك الإلكترونية المقدمة باستخدام نفس كود Java.

// Provide different eBook formats to the Parser constructor to extract the images.
// Parser parser = new Parser("ebook.epub");
Parser parser = new Parser("ebook.pdf");
// Parser parser = new Parser("ebook.fb2");
// Parser parser = new Parser("ebook.chm");

Iterable<PageImageArea> images = parser.getImages();

استنتاج

في هذه المقالة ، تعلمت الحصول على جميع الصور برمجيًا من الكتب الإلكترونية بتنسيق PDF و EPUB و FB2 و CHM داخل تطبيقات Java الخاصة بك. الآن يمكنك محاولة بناء تطبيق Java الخاص بك لاستخراج الصور باستخدام GroupDocs.Parser for Java API.

لمزيد من المعلومات حول API ، يمكنك زيارة التوثيق أو أمثلة مفتوحة المصدر على GitHub. لأية مشاكل أخرى ، يمكنك الاتصال بالدعم السريع على المنتدى.

أنظر أيضا