Elektronické knihy různých formátů jsou v každodenním používání velmi běžné. Elektronická kniha může obsahovat text i obrázky. Pokud chcete obrázky jakékoli elektronické knihy použít jinde, můžete je snadno získat programově ve své aplikaci Java. V tomto článku se naučíte automatizovat, jak extrahovat obrázky ze souborů e-knih, jako jsou EPUB, PDF, FB2, CHM v Java.
Níže budou probrána následující témata:
- Java API – extrakce obrázků z elektronických knih
- Extrahujte obrázky z elektronické knihy EPUB v Java
- Extrahujte obrázky z elektronických knih PDF, FB2, CHM v Java
Java API pro extrahování obrázků z elektronických knih
GroupDocs.Parser for Java API je funkčně bohaté automatizační API pro extrahování obrázků z elektronických knih a dokumentů v Java. Kromě toho rozhraní API podporuje analýzu a extrakci obrázků, textu a metadat z dokumentů pro zpracování textu, tabulek, PDF, prezentací, e-mailů, archivů ZIP a mnoha dalších podporovaných formátů dokumentů.
Stáhnout a nakonfigurovat
Získejte soubor JAR ze sekce ke stažení nebo jednoduše přidejte následující konfiguraci pom.xml do svých Java aplikací založených na Maven a vyzkoušejte níže uvedené příklady. Podrobnosti naleznete v Odkaz na rozhraní API.
<repository>
<id>GroupDocsJavaAPI</id>
<name>GroupDocs Java API</name>
<url>http://repository.groupdocs.com/repo/</url>
</repository>
<dependency>
<groupId>com.groupdocs</groupId>
<artifactId>groupdocs-parser</artifactId>
<version>21.2</version>
</dependency>
Extrahujte obrázky z elektronické knihy EPUB v Java
Začněme elektronickou knihou EPUB, abychom ji analyzovali na obrázky. Následující kroky analyzují elektronickou knihu EPUB a extrahují z ní všechny obrázky pomocí kódu Java.
- Vytvořte objekt třídy Parser pomocí elektronické knihy.
- Pomocí metody getImages extrahujte všechny obrázky eKnihy EPUB.
- Projděte extrahované obrázky a uložte je na disk.
Následující kód Java analyzuje eKnihu EPUB a ukládá obrázky eKnihy jeden po druhém na disk.
// Analyzujte e-knihy a extrahujte obrázky ze souborů PDF, EPUB, FB2, CHM v Java a uložte je na disk.
Parser parser = new Parser("ebook.epub");
// Extrahujte obrázky z elektronické knihy a uložte je ve formátu JPEG.
Iterable<PageImageArea> images = parser.getImages();
ImageOptions options = new ImageOptions(ImageFormat.Jpeg);
int imageNumber = 0;
// Iterujte extrahované obrázky
for (PageImageArea image : images) {
image.save(Constants.getOutputFilePath(String.format("%d.jpeg", imageNumber)), options);
imageNumber++;
}
V důsledku toho budou všechny obrázky uloženy na zadané místo. Zde je jeden z obrázků zobrazených jako ukázka.
Obrázky lze uložit v kterémkoli z následujících formátů souborů obrázků:
- JPG
- PNG
- WEBP
- GIF
- BMP
Extrahujte obrázky z elektronických knih PDF, FB2, CHM v Java
Kromě formátu EPUB, pokud máte svou eKnihu v PDF, FB2, CHM nebo v jiném formátu, můžete stejným způsobem extrahovat jejich obrázky. Při vytváření objektu stačí předat svou e-knihu konstruktoru analyzátoru. Poté bude metoda getImages extrahovat obrázky z vašich poskytnutých elektronických knih pomocí stejného kódu Java.
// Provide different eBook formats to the Parser constructor to extract the images.
// Parser parser = new Parser("ebook.epub");
Parser parser = new Parser("ebook.pdf");
// Parser parser = new Parser("ebook.fb2");
// Parser parser = new Parser("ebook.chm");
Iterable<PageImageArea> images = parser.getImages();
Závěr
V tomto článku jste se naučili programově získávat všechny obrázky z elektronických knih PDF, EPUB, FB2, CHM v rámci vašich aplikací Java. Nyní si můžete zkusit vytvořit vlastní Java aplikaci pro extraktor obrázků pomocí GroupDocs.Parser for Java API.
Další informace o rozhraní API naleznete v dokumentaci nebo v příkladech open source na GitHub. V případě dalších problémů se můžete obrátit na rychlou podporu na fóru.