Elektronické knihy různých formátů jsou v každodenním používání velmi běžné. Elektronická kniha může obsahovat text i obrázky. Pokud chcete obrázky jakékoli elektronické knihy použít jinde, můžete je snadno získat programově ve své aplikaci Java. V tomto článku se naučíte automatizovat, jak extrahovat obrázky ze souborů e-knih, jako jsou EPUB, PDF, FB2, CHM v Java.

Níže budou probrána následující témata:

Java API pro extrahování obrázků z elektronických knih

GroupDocs.Parser for Java API je funkčně bohaté automatizační API pro extrahování obrázků z elektronických knih a dokumentů v Java. Kromě toho rozhraní API podporuje analýzu a extrakci obrázků, textu a metadat z dokumentů pro zpracování textu, tabulek, PDF, prezentací, e-mailů, archivů ZIP a mnoha dalších podporovaných formátů dokumentů.

Stáhnout a nakonfigurovat

Získejte soubor JAR ze sekce ke stažení nebo jednoduše přidejte následující konfiguraci pom.xml do svých Java aplikací založených na Maven a vyzkoušejte níže uvedené příklady. Podrobnosti naleznete v Odkaz na rozhraní API.

<repository>
	<id>GroupDocsJavaAPI</id>
	<name>GroupDocs Java API</name>
	<url>http://repository.groupdocs.com/repo/</url>
</repository>
<dependency>
	<groupId>com.groupdocs</groupId>
	<artifactId>groupdocs-parser</artifactId>
	<version>21.2</version> 
</dependency>

Extrahujte obrázky z elektronické knihy EPUB v Java

Začněme elektronickou knihou EPUB, abychom ji analyzovali na obrázky. Následující kroky analyzují elektronickou knihu EPUB a extrahují z ní všechny obrázky pomocí kódu Java.

  • Vytvořte objekt třídy Parser pomocí elektronické knihy.
  • Pomocí metody getImages extrahujte všechny obrázky eKnihy EPUB.
  • Projděte extrahované obrázky a uložte je na disk.
Elektronická kniha EPUB s obrázky

Elektronická kniha EPUB z Adobe [Ukázka knihovny elektronických knih][11]

Následující kód Java analyzuje eKnihu EPUB a ukládá obrázky eKnihy jeden po druhém na disk.

// Analyzujte e-knihy a extrahujte obrázky ze souborů PDF, EPUB, FB2, CHM v Java a uložte je na disk.
Parser parser = new Parser("ebook.epub");
// Extrahujte obrázky z elektronické knihy a uložte je ve formátu JPEG.
Iterable<PageImageArea> images = parser.getImages();
ImageOptions options = new ImageOptions(ImageFormat.Jpeg);
int imageNumber = 0;
// Iterujte extrahované obrázky
for (PageImageArea image : images) {
    image.save(Constants.getOutputFilePath(String.format("%d.jpeg", imageNumber)), options);
    imageNumber++;
}
Extrahovaný obrázek z elektronické knihy EPUB

V důsledku toho budou všechny obrázky uloženy na zadané místo. Zde je jeden z obrázků zobrazených jako ukázka.

Obrázky lze uložit v kterémkoli z následujících formátů souborů obrázků:

  • JPG
  • PNG
  • WEBP
  • GIF
  • BMP

Extrahujte obrázky z elektronických knih PDF, FB2, CHM v Java

Kromě formátu EPUB, pokud máte svou eKnihu v PDF, FB2, CHM nebo v jiném formátu, můžete stejným způsobem extrahovat jejich obrázky. Při vytváření objektu stačí předat svou e-knihu konstruktoru analyzátoru. Poté bude metoda getImages extrahovat obrázky z vašich poskytnutých elektronických knih pomocí stejného kódu Java.

// Provide different eBook formats to the Parser constructor to extract the images.
// Parser parser = new Parser("ebook.epub");
Parser parser = new Parser("ebook.pdf");
// Parser parser = new Parser("ebook.fb2");
// Parser parser = new Parser("ebook.chm");

Iterable<PageImageArea> images = parser.getImages();

Závěr

V tomto článku jste se naučili programově získávat všechny obrázky z elektronických knih PDF, EPUB, FB2, CHM v rámci vašich aplikací Java. Nyní si můžete zkusit vytvořit vlastní Java aplikaci pro extraktor obrázků pomocí GroupDocs.Parser for Java API.

Další informace o rozhraní API naleznete v dokumentaci nebo v příkladech open source na GitHub. V případě dalších problémů se můžete obrátit na rychlou podporu na fóru.

Viz také