کتاب های الکترونیکی با فرمت های مختلف در استفاده روزمره بسیار رایج هستند. کتاب الکترونیکی می تواند شامل متن و همچنین تصاویر باشد. اگر میخواهید از تصاویر هر کتاب الکترونیکی در جای دیگری استفاده کنید، میتوانید آنها را به راحتی از طریق برنامهنویسی در برنامه Java خود استخراج کنید. در این مقاله، نحوه استخراج تصاویر از فایل های کتاب الکترونیکی مانند EPUB، PDF، FB2، CHM در Java را به صورت خودکار یاد خواهید گرفت.
موضوعات زیر در زیر پوشش داده خواهد شد:
- Java API - استخراج تصویر از کتاب های الکترونیکی
- استخراج تصاویر از کتاب الکترونیکی EPUB در جاوا
- استخراج تصاویر از PDF، FB2، کتابهای الکترونیکی CHM در جاوا
Java API برای استخراج تصاویر از کتاب های الکترونیکی
GroupDocs.Parser for Java API یک API اتوماسیون غنی از ویژگی ها برای استخراج تصاویر از کتاب های الکترونیکی و اسناد در Java است. علاوه بر این، API از تجزیه و استخراج تصاویر، متن و ابرداده از اسناد پردازش کلمه، صفحات گسترده، PDF، ارائهها، ایمیلها، بایگانیهای ZIP و بسیاری دیگر [فرمتهای سند پشتیبانی شده6 پشتیبانی میکند.
دانلود و پیکربندی کنید
فایل JAR را از بخش دانلودها دریافت کنید، یا فقط پیکربندی pom.xml زیر را در برنامههای Java مبتنی بر Maven خود اضافه کنید تا نمونههای ذکر شده در زیر را امتحان کنید. برای جزئیات، می توانید از مرجع API دیدن کنید.
<repository>
<id>GroupDocsJavaAPI</id>
<name>GroupDocs Java API</name>
<url>http://repository.groupdocs.com/repo/</url>
</repository>
<dependency>
<groupId>com.groupdocs</groupId>
<artifactId>groupdocs-parser</artifactId>
<version>21.2</version>
</dependency>
استخراج تصاویر از کتاب الکترونیکی EPUB در Java
بیایید با کتاب الکترونیکی EPUB شروع کنیم تا آن را برای تصاویر تجزیه کنیم. مراحل زیر کتاب الکترونیکی EPUB را تجزیه می کند و با استفاده از کد جاوا، تمام تصاویر را از آن استخراج می کند.
- شیء کلاس Parser را با کتاب الکترونیکی ایجاد کنید.
- از روش getImages برای استخراج تمام تصاویر کتاب الکترونیکی EPUB استفاده کنید.
- تصاویر استخراج شده را طی کنید و آنها را در دیسک ذخیره کنید.
کد Java زیر کتاب الکترونیکی EPUB را تجزیه می کند و تصاویر کتاب الکترونیکی را یک به یک در دیسک ذخیره می کند.
// کتابهای الکترونیکی را برای استخراج تصاویر از فایلهای PDF، EPUB، FB2، CHM در Java تجزیه کنید و روی دیسک ذخیره کنید.
Parser parser = new Parser("ebook.epub");
// تصاویر را از کتاب الکترونیکی استخراج کرده و با فرمت JPEG ذخیره کنید.
Iterable<PageImageArea> images = parser.getImages();
ImageOptions options = new ImageOptions(ImageFormat.Jpeg);
int imageNumber = 0;
// تکرار روی تصاویر استخراج شده
for (PageImageArea image : images) {
image.save(Constants.getOutputFilePath(String.format("%d.jpeg", imageNumber)), options);
imageNumber++;
}
در نتیجه تمام تصاویر در محل ارائه شده ذخیره می شوند. در اینجا یکی از تصاویر نشان داده شده به عنوان نمونه است.
تصاویر را می توان در هر یک از فرمت های فایل تصویری زیر ذخیره کرد:
- JPG
- PNG
- WEBP
- GIF
- BMP
استخراج تصاویر از PDF، FB2، کتابهای الکترونیکی CHM در Java
علاوه بر فرمت EPUB، اگر کتاب الکترونیکی خود را با فرمت PDF، FB2، CHM یا با فرمت دیگری دارید، می توانید تصاویر آنها را به همین روش استخراج کنید. فقط هنگام ایجاد شیء، کتاب الکترونیکی خود را به سازنده Parser ارسال کنید. پس از آن، متد getImages با استفاده از همان کد جاوا، تصاویر را از کتاب های الکترونیکی ارائه شده شما استخراج می کند.
// Provide different eBook formats to the Parser constructor to extract the images.
// Parser parser = new Parser("ebook.epub");
Parser parser = new Parser("ebook.pdf");
// Parser parser = new Parser("ebook.fb2");
// Parser parser = new Parser("ebook.chm");
Iterable<PageImageArea> images = parser.getImages();
نتیجه
در این مقاله، یاد گرفتید که به صورت برنامهنویسی تمام تصاویر را از کتابهای الکترونیکی PDF، EPUB، FB2، CHM در برنامههای Java خود دریافت کنید. اکنون می توانید سعی کنید برنامه Java استخراج کننده تصویر خود را با استفاده از GroupDocs.Parser for Java API بسازید.
برای اطلاعات بیشتر در مورد API، می توانید از documentation یا نمونه های منبع باز در GitHub دیدن کنید. برای هر گونه مشکل بیشتر، می توانید با پشتیبانی سریع در [فروم 15 تماس بگیرید.