کتاب های الکترونیکی با فرمت های مختلف در استفاده روزمره بسیار رایج هستند. کتاب الکترونیکی می تواند شامل متن و همچنین تصاویر باشد. اگر می‌خواهید از تصاویر هر کتاب الکترونیکی در جای دیگری استفاده کنید، می‌توانید آن‌ها را به راحتی از طریق برنامه‌نویسی در برنامه Java خود استخراج کنید. در این مقاله، نحوه استخراج تصاویر از فایل های کتاب الکترونیکی مانند EPUB، PDF، FB2، CHM در Java را به صورت خودکار یاد خواهید گرفت.

موضوعات زیر در زیر پوشش داده خواهد شد:

Java API برای استخراج تصاویر از کتاب های الکترونیکی

GroupDocs.Parser for Java API یک API اتوماسیون غنی از ویژگی ها برای استخراج تصاویر از کتاب های الکترونیکی و اسناد در Java است. علاوه بر این، API از تجزیه و استخراج تصاویر، متن و ابرداده از اسناد پردازش کلمه، صفحات گسترده، PDF، ارائه‌ها، ایمیل‌ها، بایگانی‌های ZIP و بسیاری دیگر [فرمت‌های سند پشتیبانی شده6 پشتیبانی می‌کند.

دانلود و پیکربندی کنید

فایل JAR را از بخش دانلودها دریافت کنید، یا فقط پیکربندی pom.xml زیر را در برنامه‌های Java مبتنی بر Maven خود اضافه کنید تا نمونه‌های ذکر شده در زیر را امتحان کنید. برای جزئیات، می توانید از مرجع API دیدن کنید.

<repository>
	<id>GroupDocsJavaAPI</id>
	<name>GroupDocs Java API</name>
	<url>http://repository.groupdocs.com/repo/</url>
</repository>
<dependency>
	<groupId>com.groupdocs</groupId>
	<artifactId>groupdocs-parser</artifactId>
	<version>21.2</version> 
</dependency>

استخراج تصاویر از کتاب الکترونیکی EPUB در Java

بیایید با کتاب الکترونیکی EPUB شروع کنیم تا آن را برای تصاویر تجزیه کنیم. مراحل زیر کتاب الکترونیکی EPUB را تجزیه می کند و با استفاده از کد جاوا، تمام تصاویر را از آن استخراج می کند.

  • شیء کلاس Parser را با کتاب الکترونیکی ایجاد کنید.
  • از روش getImages برای استخراج تمام تصاویر کتاب الکترونیکی EPUB استفاده کنید.
  • تصاویر استخراج شده را طی کنید و آنها را در دیسک ذخیره کنید.
کتاب الکترونیکی EPUB با تصاویر

کتاب الکترونیکی EPUB از Adobe [کتابخانه نمونه الکترونیکی][11]

کد Java زیر کتاب الکترونیکی EPUB را تجزیه می کند و تصاویر کتاب الکترونیکی را یک به یک در دیسک ذخیره می کند.

// کتاب‌های الکترونیکی را برای استخراج تصاویر از فایل‌های PDF، EPUB، FB2، CHM در Java تجزیه کنید و روی دیسک ذخیره کنید.
Parser parser = new Parser("ebook.epub");
// تصاویر را از کتاب الکترونیکی استخراج کرده و با فرمت JPEG ذخیره کنید.
Iterable<PageImageArea> images = parser.getImages();
ImageOptions options = new ImageOptions(ImageFormat.Jpeg);
int imageNumber = 0;
// تکرار روی تصاویر استخراج شده
for (PageImageArea image : images) {
    image.save(Constants.getOutputFilePath(String.format("%d.jpeg", imageNumber)), options);
    imageNumber++;
}
تصویر استخراج شده از کتاب الکترونیکی EPUB

در نتیجه تمام تصاویر در محل ارائه شده ذخیره می شوند. در اینجا یکی از تصاویر نشان داده شده به عنوان نمونه است.

تصاویر را می توان در هر یک از فرمت های فایل تصویری زیر ذخیره کرد:

  • JPG
  • PNG
  • WEBP
  • GIF
  • BMP

استخراج تصاویر از PDF، FB2، کتابهای الکترونیکی CHM در Java

علاوه بر فرمت EPUB، اگر کتاب الکترونیکی خود را با فرمت PDF، FB2، CHM یا با فرمت دیگری دارید، می توانید تصاویر آنها را به همین روش استخراج کنید. فقط هنگام ایجاد شیء، کتاب الکترونیکی خود را به سازنده Parser ارسال کنید. پس از آن، متد getImages با استفاده از همان کد جاوا، تصاویر را از کتاب های الکترونیکی ارائه شده شما استخراج می کند.

// Provide different eBook formats to the Parser constructor to extract the images.
// Parser parser = new Parser("ebook.epub");
Parser parser = new Parser("ebook.pdf");
// Parser parser = new Parser("ebook.fb2");
// Parser parser = new Parser("ebook.chm");

Iterable<PageImageArea> images = parser.getImages();

نتیجه

در این مقاله، یاد گرفتید که به صورت برنامه‌نویسی تمام تصاویر را از کتاب‌های الکترونیکی PDF، EPUB، FB2، CHM در برنامه‌های Java خود دریافت کنید. اکنون می توانید سعی کنید برنامه Java استخراج کننده تصویر خود را با استفاده از GroupDocs.Parser for Java API بسازید.

برای اطلاعات بیشتر در مورد API، می توانید از documentation یا نمونه های منبع باز در GitHub دیدن کنید. برای هر گونه مشکل بیشتر، می توانید با پشتیبانی سریع در [فروم 15 تماس بگیرید.

همچنین ببینید