Buku elektronik yang populer dengan sebutan eBook adalah buku dalam bentuk digital yang dapat dibaca di berbagai perangkat elektronik. Perangkat ini termasuk eReader khusus seperti Kindle, atau laptop, komputer desktop, dan smartphone. Ada banyak format file eBuku populer yang digunakan di pasar yang meliputi; EPUB, FictionBook FB2, Microsoft Compiled HTML Help - CHM, DjVu, MOBI, PDF, dan banyak lainnya. Sebagai seorang programmer, artikel ini akan membantu Anda mengekstrak gambar secara terprogram dari eBook di C# dalam aplikasi .NET.

Topik-topik berikut akan dibahas di bawah ini:

.NET API untuk Ekstraksi Gambar dari eBuku

Untuk ekstraksi gambar dari eBook, saya akan menggunakan GroupDocs.Parser for .NET API dalam contoh C# di artikel ini. Bersama dengan eBuku, API ini mendukung parsing, dan ekstraksi gambar dari dokumen pengolah kata, spreadsheet, PDF, presentasi, email, arsip ZIP, dan banyak format dokumen lainnya.

Anda dapat mengunduh penginstal DLL atau MSI dari bagian unduhan atau menginstal API di aplikasi .NET Anda melalui NuGet.

PM> Install-Package GroupDocs.Parser

Ekstrak Gambar dari EPUB eBook di C#

Mari kita mulai dengan eBuku EPUB untuk menguraikannya untuk gambar. Langkah-langkah berikut diikuti oleh kode C# mem-parsing eBook EPUB dan mengekstrak semua gambar di dalamnya.

  • Buat objek kelas Parser.
  • Gunakan metode GetImages untuk mengekstrak semua gambar dari eBook EPUB.
  • Lintasi gambar yang diekstraksi untuk menyimpan ini, satu per satu.
alice EPUB

eBook EPUB dari Adobe [Sample eBook Library][12]

Kode C# berikut mengimplementasikan langkah-langkah penguraian yang disebutkan untuk mem-parsing eBuku EPUB yang ditampilkan di atas dan menyimpan gambar ekstrak satu per satu ke disk.

// Parsing eBuku untuk Mengekstrak Gambar dari file EPUB, FB2, CHM dan simpan ke disk di C#
using (Parser parser = new Parser("ebook.epub"))
{
    // Ekstrak gambar dari eBuku
    IEnumerable<PageImageArea> images = parser.GetImages();
    ImageOptions options = new ImageOptions(ImageFormat.Jpeg);
    int imageNumber = 0;
    // Ulangi gambar yang diekstraksi
    foreach (PageImageArea image in images)
    {
        image.Save(("Image-" + imageNumber.ToString() + image.FileType.Extension), options);
        imageNumber++;
    }
}
Ekstrak Gambar dari EPUB di C#

Akibatnya, semua gambar yang tersedia akan disimpan. Berikut adalah salah satu gambar yang ditampilkan sebagai sampel.

Anda dapat menyimpan gambar yang diekstraksi dalam salah satu format file gambar yang didukung berikut ini:

  • JPG
  • PNG
  • WEBP
  • GIF
  • BMP

Ekstrak Gambar dari FB2, CHM eBook di C#

Jika Anda memiliki eBuku di FB2, CHM, atau dengan format lain, Anda dapat mengekstrak gambarnya dengan cara yang sama. Anda hanya perlu meneruskan eBuku Anda ke konstruktor Parser saat membuat objek. Kemudian metode GetImages akan mengekstraksi gambar dari salah satu eBuku yang disediakan menggunakan kode C# yang sama.

// Pass the FB2, CHM, PDF, or any other eBook to Parser contructor
Parser parser = new Parser("ebook.fb2"); // FB2
// Parser parser = new Parser("ebook.chm"); // CHM
// Parser parser = new Parser("ebook.pdf"); // PDF
IEnumerable<PageImageArea> images = parser.GetImages();

Kesimpulan

Saya harap sekarang Anda merasa nyaman dalam mendapatkan semua gambar dari eBuku secara terprogram dengan EPUB, FB2, CHM, dan format file lainnya dalam aplikasi .NET Anda. Anda bahkan dapat membuat aplikasi pengekstrak gambar sendiri menggunakan GroupDocs.Parser for .NET API.

Untuk informasi lebih lanjut tentang API, Anda dapat mengunjungi dokumentasi atau contoh sumber terbuka di GitHub. Untuk masalah lebih lanjut, Anda dapat menghubungi dukungan cepat di forum.

Lihat juga