Çeşitli formatlardaki e-Kitaplar günlük kullanımda çok yaygındır. E-Kitap, resimlerin yanı sıra metin içerebilir. Herhangi bir e-Kitabın resimlerini başka bir yerde kullanmak isterseniz, bunların Java uygulamanız içinde programlı olarak kolayca çıkarılmasını sağlayabilirsiniz. Bu yazıda, Java’da EPUB, PDF, FB2, CHM gibi e-Kitap dosyalarından görüntüleri nasıl otomatikleştireceğinizi öğreneceksiniz.

Aşağıdaki konular aşağıda ele alınacaktır:

E-Kitaplardan Görüntüleri Çıkarmak için Java API

GroupDocs.Parser for Java API, Java’daki e-Kitaplardan ve belgelerden görüntüleri ayıklamak için zengin özelliklere sahip bir otomasyon API’sidir. Buna ek olarak API, kelime işlemci belgeleri, e-tablolar, PDF, sunumlar, e-postalar, ZIP arşivleri ve diğer birçok [desteklenen belge formatlarından] görüntülerin, metinlerin ve meta verilerin ayrıştırılmasını ve çıkarılmasını destekler.

İndirin ve Yapılandırın

JAR dosyasını indirilenler bölümünden alın veya aşağıda belirtilen örnekleri denemek için Maven tabanlı Java uygulamalarınıza aşağıdaki pom.xml yapılandırmasını ekleyin. Ayrıntılar için API Referansı’nı ziyaret edebilirsiniz.

<repository>
	<id>GroupDocsJavaAPI</id>
	<name>GroupDocs Java API</name>
	<url>http://repository.groupdocs.com/repo/</url>
</repository>
<dependency>
	<groupId>com.groupdocs</groupId>
	<artifactId>groupdocs-parser</artifactId>
	<version>21.2</version> 
</dependency>

Java’daki EPUB e-Kitabından Görüntüleri Çıkarın

Görüntüleri ayrıştırmak için EPUB e-Kitabı ile başlayalım. Aşağıdaki adımlar, EPUB e-Kitabını ayrıştırır ve Java kodunu kullanarak içindeki tüm görüntüleri çıkarır.

  • eKitap ile Parser sınıf nesnesi oluşturun.
  • EPUB e-Kitabının tüm resimlerini çıkarmak için getImages yöntemini kullanın.
  • Ayıklanan görüntüleri çaprazlayın ve diske kaydedin.
Resimlerle EPUB e-Kitap

Adobe [Örnek e-Kitap Kitaplığı]’ndan [11] EPUB e-Kitabı

Aşağıdaki Java kodu, EPUB eKitabını ayrıştırır ve eKitabın resimlerini birer birer diske kaydeder.

// Java'daki PDF, EPUB, FB2, CHM dosyalarından Görüntüleri Ayıklamak için e-Kitapları Ayrıştırın ve diske kaydedin.
Parser parser = new Parser("ebook.epub");
// Resimleri eKitaptan çıkarın ve JPEG formatında kaydedin.
Iterable<PageImageArea> images = parser.getImages();
ImageOptions options = new ImageOptions(ImageFormat.Jpeg);
int imageNumber = 0;
// Ayıklanan görüntüler üzerinde yineleme yapın
for (PageImageArea image : images) {
    image.save(Constants.getOutputFilePath(String.format("%d.jpeg", imageNumber)), options);
    imageNumber++;
}
EPUB e-Kitaptan Çıkarılan Görüntü

Sonuç olarak, tüm resimler sağlanan konuma kaydedilecektir. İşte örnek olarak gösterilen resimlerden biri.

Görüntüler, aşağıdaki görüntü dosyası biçimlerinden herhangi birinde kaydedilebilir:

  • JPG
  • png
  • WEBP
  • GIF
  • BMP

Java’da PDF, FB2, CHM e-Kitaplarından Görüntüleri Çıkarın

EPUB formatına ek olarak, e-Kitabınızı PDF, FB2, CHM veya başka bir formata sahipseniz, bunların resimlerini de aynı şekilde çıkarabilirsiniz. Nesneyi oluştururken e-Kitabınızı Parser yapıcısına iletmeniz yeterlidir. Bundan sonra, getImages yöntemi, aynı Java kodunu kullanarak sağladığınız e-Kitaplardan resimler çıkaracaktır.

// Provide different eBook formats to the Parser constructor to extract the images.
// Parser parser = new Parser("ebook.epub");
Parser parser = new Parser("ebook.pdf");
// Parser parser = new Parser("ebook.fb2");
// Parser parser = new Parser("ebook.chm");

Iterable<PageImageArea> images = parser.getImages();

Çözüm

Bu makalede, Java uygulamalarınızdaki PDF, EPUB, FB2, CHM e-Kitaplardaki tüm görüntüleri programlı olarak almayı öğrendiniz. Artık GroupDocs.Parser for Java API kullanarak kendi görüntü çıkarıcı Java uygulamanızı oluşturmayı deneyebilirsiniz.

API hakkında daha fazla bilgi için documentation sayfasını veya GitHub adresindeki açık kaynak örneklerini ziyaret edebilirsiniz. Diğer sorunlar için forumda hızlı destekle iletişime geçebilirsiniz.

Ayrıca bakınız