Çeşitli formatlardaki e-Kitaplar günlük kullanımda çok yaygındır. E-Kitap, resimlerin yanı sıra metin içerebilir. Herhangi bir e-Kitabın resimlerini başka bir yerde kullanmak isterseniz, bunların Java uygulamanız içinde programlı olarak kolayca çıkarılmasını sağlayabilirsiniz. Bu yazıda, Java’da EPUB, PDF, FB2, CHM gibi e-Kitap dosyalarından görüntüleri nasıl otomatikleştireceğinizi öğreneceksiniz.
Aşağıdaki konular aşağıda ele alınacaktır:
- Java API - e-Kitaplardan Resim Çıkarma
- Java’daki EPUB e-Kitabından Görüntüleri Çıkarın
- Java’da PDF, FB2, CHM e-Kitaplarından Görüntüleri Çıkarın
E-Kitaplardan Görüntüleri Çıkarmak için Java API
GroupDocs.Parser for Java API, Java’daki e-Kitaplardan ve belgelerden görüntüleri ayıklamak için zengin özelliklere sahip bir otomasyon API’sidir. Buna ek olarak API, kelime işlemci belgeleri, e-tablolar, PDF, sunumlar, e-postalar, ZIP arşivleri ve diğer birçok [desteklenen belge formatlarından] görüntülerin, metinlerin ve meta verilerin ayrıştırılmasını ve çıkarılmasını destekler.
İndirin ve Yapılandırın
JAR dosyasını indirilenler bölümünden alın veya aşağıda belirtilen örnekleri denemek için Maven tabanlı Java uygulamalarınıza aşağıdaki pom.xml yapılandırmasını ekleyin. Ayrıntılar için API Referansı’nı ziyaret edebilirsiniz.
<repository>
<id>GroupDocsJavaAPI</id>
<name>GroupDocs Java API</name>
<url>http://repository.groupdocs.com/repo/</url>
</repository>
<dependency>
<groupId>com.groupdocs</groupId>
<artifactId>groupdocs-parser</artifactId>
<version>21.2</version>
</dependency>
Java’daki EPUB e-Kitabından Görüntüleri Çıkarın
Görüntüleri ayrıştırmak için EPUB e-Kitabı ile başlayalım. Aşağıdaki adımlar, EPUB e-Kitabını ayrıştırır ve Java kodunu kullanarak içindeki tüm görüntüleri çıkarır.
- eKitap ile Parser sınıf nesnesi oluşturun.
- EPUB e-Kitabının tüm resimlerini çıkarmak için getImages yöntemini kullanın.
- Ayıklanan görüntüleri çaprazlayın ve diske kaydedin.
Aşağıdaki Java kodu, EPUB eKitabını ayrıştırır ve eKitabın resimlerini birer birer diske kaydeder.
// Java'daki PDF, EPUB, FB2, CHM dosyalarından Görüntüleri Ayıklamak için e-Kitapları Ayrıştırın ve diske kaydedin.
Parser parser = new Parser("ebook.epub");
// Resimleri eKitaptan çıkarın ve JPEG formatında kaydedin.
Iterable<PageImageArea> images = parser.getImages();
ImageOptions options = new ImageOptions(ImageFormat.Jpeg);
int imageNumber = 0;
// Ayıklanan görüntüler üzerinde yineleme yapın
for (PageImageArea image : images) {
image.save(Constants.getOutputFilePath(String.format("%d.jpeg", imageNumber)), options);
imageNumber++;
}
Sonuç olarak, tüm resimler sağlanan konuma kaydedilecektir. İşte örnek olarak gösterilen resimlerden biri.
Görüntüler, aşağıdaki görüntü dosyası biçimlerinden herhangi birinde kaydedilebilir:
- JPG
- png
- WEBP
- GIF
- BMP
Java’da PDF, FB2, CHM e-Kitaplarından Görüntüleri Çıkarın
EPUB formatına ek olarak, e-Kitabınızı PDF, FB2, CHM veya başka bir formata sahipseniz, bunların resimlerini de aynı şekilde çıkarabilirsiniz. Nesneyi oluştururken e-Kitabınızı Parser yapıcısına iletmeniz yeterlidir. Bundan sonra, getImages yöntemi, aynı Java kodunu kullanarak sağladığınız e-Kitaplardan resimler çıkaracaktır.
// Provide different eBook formats to the Parser constructor to extract the images.
// Parser parser = new Parser("ebook.epub");
Parser parser = new Parser("ebook.pdf");
// Parser parser = new Parser("ebook.fb2");
// Parser parser = new Parser("ebook.chm");
Iterable<PageImageArea> images = parser.getImages();
Çözüm
Bu makalede, Java uygulamalarınızdaki PDF, EPUB, FB2, CHM e-Kitaplardaki tüm görüntüleri programlı olarak almayı öğrendiniz. Artık GroupDocs.Parser for Java API kullanarak kendi görüntü çıkarıcı Java uygulamanızı oluşturmayı deneyebilirsiniz.
API hakkında daha fazla bilgi için documentation sayfasını veya GitHub adresindeki açık kaynak örneklerini ziyaret edebilirsiniz. Diğer sorunlar için forumda hızlı destekle iletişime geçebilirsiniz.