ספרים אלקטרוניים בפורמטים שונים נפוצים מאוד בשימוש יומיומי. הספר האלקטרוני יכול להכיל טקסט וגם תמונות. אם אתה רוצה להשתמש בתמונות של כל ספר אלקטרוני במקום אחר, אתה יכול לחלץ אותן בקלות באופן תוכנתי בתוך יישום Java שלך. במאמר זה תלמד לבצע אוטומציה, כיצד לחלץ תמונות מקובצי ספר אלקטרוני כגון EPUB, PDF, FB2, CHM ב-Java.

הנושאים הבאים יכוסו להלן:

Java API לחילוץ תמונות מספרים אלקטרוניים

GroupDocs.Parser for Java API הוא API עתיר תכונות לאוטומציה לחילוץ תמונות מספרים אלקטרוניים ומסמכים ב-Java. בנוסף לכך, ה-API תומך בניתוח וחילוץ של תמונות, טקסט ומטא נתונים ממסמכי עיבוד תמלילים, גיליונות אלקטרוניים, PDF, מצגות, מיילים, ארכיוני ZIP ועוד רבים אחרים פורמטים נתמכים של מסמכים.

הורד והגדר

קבל את קובץ ה-JAR מהקטע הורדות, או פשוט הוסף את תצורת pom.xml הבאה ביישומי Java מבוססי Maven כדי לנסות את הדוגמאות המוזכרות להלן. לפרטים, אתה יכול לבקר ב-API Reference.

<repository>
	<id>GroupDocsJavaAPI</id>
	<name>GroupDocs Java API</name>
	<url>http://repository.groupdocs.com/repo/</url>
</repository>
<dependency>
	<groupId>com.groupdocs</groupId>
	<artifactId>groupdocs-parser</artifactId>
	<version>21.2</version> 
</dependency>

חלץ תמונות מ-EPUB eBook ב-Java

נתחיל עם הספר האלקטרוני EPUB כדי לנתח אותו לתמונות. השלבים הבאים מנתחים את הספר האלקטרוני EPUB ומחלצים ממנו את כל התמונות באמצעות קוד Java.

  • צור אובייקט מחלקה Parser עם הספר האלקטרוני.
  • השתמש בשיטת getImages כדי לחלץ את כל התמונות של הספר האלקטרוני EPUB.
  • חצו את התמונות שחולצו ושמור אותן בדיסק.
ספר אלקטרוני EPUB עם תמונות

ספר אלקטרוני EPUB מ-Adobe [ספריית ספרים אלקטרוניים לדוגמה][11]

קוד ה-Java הבא מנתח את הספר האלקטרוני EPUB ושומר את התמונות של הספר האלקטרוני בדיסק אחד אחד.

// נתח ספרים אלקטרוניים כדי לחלץ תמונות מקובצי PDF, EPUB, FB2, CHM ב-Java ושמור בדיסק.
Parser parser = new Parser("ebook.epub");
// חלץ תמונות מהספר האלקטרוני ושמור בפורמט JPEG.
Iterable<PageImageArea> images = parser.getImages();
ImageOptions options = new ImageOptions(ImageFormat.Jpeg);
int imageNumber = 0;
// חזור על תמונות שחולצו
for (PageImageArea image : images) {
    image.save(Constants.getOutputFilePath(String.format("%d.jpeg", imageNumber)), options);
    imageNumber++;
}
תמונה שחולצה מהספר האלקטרוני EPUB

כתוצאה מכך, כל התמונות יישמרו במיקום המסופק. הנה אחת התמונות המוצגות כדוגמה.

ניתן לשמור את התמונות בכל אחד מהפורמטים הבאים של קבצי התמונה:

  • JPG
  • PNG
  • WEBP
  • GIF
  • BMP

חלץ תמונות מ-PDF, FB2, CHM ספרי אלקטרוני ב-Java

בנוסף לפורמט EPUB, אם יש לך ספר אלקטרוני ב-PDF, FB2, CHM, או עם פורמט אחר, אתה יכול לחלץ את התמונות שלהם באותו אופן. פשוט העבר את הספר האלקטרוני שלך לבנאי מנתח בזמן יצירת האובייקט. לאחר מכן, שיטת getImages תשלוף תמונות מהספרים האלקטרוניים שסופקו באמצעות אותו קוד Java.

// Provide different eBook formats to the Parser constructor to extract the images.
// Parser parser = new Parser("ebook.epub");
Parser parser = new Parser("ebook.pdf");
// Parser parser = new Parser("ebook.fb2");
// Parser parser = new Parser("ebook.chm");

Iterable<PageImageArea> images = parser.getImages();

סיכום

במאמר זה, למדת לקבל באופן פרוגרמטי את כל התמונות מ-PDF, EPUB, FB2, CHM eBooks בתוך יישומי Java שלך. כעת אתה יכול לנסות לבנות אפליקציית Java משלך לחלץ תמונות באמצעות GroupDocs.Parser for Java API.

למידע נוסף על ה-API, תוכל לבקר בתיעוד או בדוגמאות של קוד פתוח ב-GitHub. לכל בעיה נוספת, תוכל ליצור קשר עם התמיכה המהירה בפורום.

ראה גם