eBook dengan berbagai format sangat umum digunakan sehari-hari. EBuku dapat berisi teks dan juga gambar. Jika Anda ingin menggunakan gambar dari eBook mana pun di tempat lain, Anda bisa mendapatkannya dengan mudah diekstraksi secara terprogram dalam aplikasi Java Anda. Pada artikel ini, Anda akan belajar mengotomatisasi, cara mengekstrak gambar dari file eBook seperti EPUB, PDF, FB2, CHM di Java.

Topik-topik berikut akan dibahas di bawah ini:

Java API untuk Mengekstrak Gambar dari eBook

GroupDocs.Parser for Java API adalah API otomasi kaya fitur untuk mengekstrak gambar dari eBook dan dokumen di Java. Selain itu, API mendukung parsing, dan ekstraksi gambar, teks, dan metadata dari dokumen pengolah kata, spreadsheet, PDF, presentasi, email, arsip ZIP, dan banyak [format dokumen yang didukung] lainnya6.

Unduh dan Konfigurasi

Dapatkan file JAR dari bagian downloads, atau cukup tambahkan konfigurasi pom.xml berikut di aplikasi Java berbasis Maven Anda untuk mencoba contoh yang disebutkan di bawah. Untuk detailnya, Anda dapat mengunjungi Referensi API.

<repository>
	<id>GroupDocsJavaAPI</id>
	<name>GroupDocs Java API</name>
	<url>http://repository.groupdocs.com/repo/</url>
</repository>
<dependency>
	<groupId>com.groupdocs</groupId>
	<artifactId>groupdocs-parser</artifactId>
	<version>21.2</version> 
</dependency>

Ekstrak Gambar dari EPUB eBook di Java

Mari kita mulai dengan eBuku EPUB untuk menguraikannya untuk gambar. Langkah-langkah berikut mem-parsing eBook EPUB dan mengekstrak semua gambar darinya menggunakan kode Java.

  • Buat objek kelas Parser dengan eBuku.
  • Gunakan metode getImages untuk mengekstrak semua gambar dari eBuku EPUB.
  • Lintasi gambar yang diekstraksi dan simpan ke disk.
eBuku EPUB dengan gambar

eBook EPUB dari Adobe [Sample eBook Library][11]

Kode Java berikut mem-parsing eBuku EPUB dan menyimpan gambar eBuku satu per satu ke disk.

// Parsing eBuku untuk Mengekstrak Gambar dari file PDF, EPUB, FB2, CHM di Java dan simpan ke disk.
Parser parser = new Parser("ebook.epub");
// Ekstrak gambar dari eBook dan simpan dalam format JPEG.
Iterable<PageImageArea> images = parser.getImages();
ImageOptions options = new ImageOptions(ImageFormat.Jpeg);
int imageNumber = 0;
// Ulangi gambar yang diekstraksi
for (PageImageArea image : images) {
    image.save(Constants.getOutputFilePath(String.format("%d.jpeg", imageNumber)), options);
    imageNumber++;
}
Gambar yang diekstrak dari EPUB eBook

Akibatnya, semua gambar akan disimpan ke lokasi yang disediakan. Berikut adalah salah satu gambar yang ditampilkan sebagai sampel.

Gambar dapat disimpan dalam salah satu format file gambar berikut:

  • JPG
  • PNG
  • WEBP
  • GIF
  • BMP

Ekstrak Gambar dari eBook PDF, FB2, CHM di Java

Selain format EPUB, jika Anda memiliki eBook dalam format PDF, FB2, CHM, atau dengan format lain, Anda dapat mengekstrak gambarnya dengan cara yang sama. Cukup berikan eBuku Anda ke konstruktor Parser saat membuat objek. Setelah itu, metode getImages akan mengekstraksi gambar dari eBuku yang Anda sediakan menggunakan kode Java yang sama.

// Provide different eBook formats to the Parser constructor to extract the images.
// Parser parser = new Parser("ebook.epub");
Parser parser = new Parser("ebook.pdf");
// Parser parser = new Parser("ebook.fb2");
// Parser parser = new Parser("ebook.chm");

Iterable<PageImageArea> images = parser.getImages();

Kesimpulan

Pada artikel ini, Anda belajar untuk secara terprogram mendapatkan semua gambar dari eBook PDF, EPUB, FB2, CHM dalam aplikasi Java Anda. Sekarang Anda dapat mencoba membuat aplikasi Java ekstraktor gambar Anda sendiri menggunakan GroupDocs.Parser for Java API.

Untuk informasi lebih lanjut tentang API, Anda dapat mengunjungi dokumentasi atau contoh sumber terbuka di GitHub. Untuk masalah lebih lanjut, Anda dapat menghubungi dukungan cepat di forum.

Lihat juga