eBook di vari formati sono molto comuni nell’uso quotidiano. L’eBook può contenere testo e immagini. Se desideri utilizzare le immagini di qualsiasi eBook altrove, puoi ottenerle facilmente estratte a livello di codice all’interno della tua applicazione Java. In questo articolo imparerai ad automatizzare come estrarre immagini da file eBook come EPUB, PDF, FB2, CHM in Java.

Di seguito verranno trattati i seguenti argomenti:

API Java per estrarre immagini da eBook

GroupDocs.Parser for Java API è un’API di automazione ricca di funzionalità per l’estrazione di immagini da eBook e documenti in Java. Oltre a ciò, l’API supporta l’analisi e l’estrazione di immagini, testo e metadati da documenti di elaborazione testi, fogli di calcolo, PDF, presentazioni, e-mail, archivi ZIP e molti altri formati di documento supportati.

Scarica e configura

Ottieni il file JAR dalla sezione download o aggiungi semplicemente la seguente configurazione pom.xml nelle tue applicazioni Java basate su Maven per provare gli esempi indicati di seguito. Per i dettagli, puoi visitare il Riferimento API.

<repository>
	<id>GroupDocsJavaAPI</id>
	<name>GroupDocs Java API</name>
	<url>http://repository.groupdocs.com/repo/</url>
</repository>
<dependency>
	<groupId>com.groupdocs</groupId>
	<artifactId>groupdocs-parser</artifactId>
	<version>21.2</version> 
</dependency>

Estrai immagini dall’eBook EPUB in Java

Iniziamo con l’eBook EPUB per analizzarlo per le immagini. I seguenti passaggi analizzano l’eBook EPUB ed estraggono tutte le immagini da esso utilizzando il codice Java.

  • Crea un oggetto classe Parser con l’eBook.
  • Usa il metodo getImages per estrarre tutte le immagini dell’eBook EPUB.
  • Attraversa le immagini estratte e salvale su disco.
eBook EPUB con immagini

eBook EPUB da Adobe [Libreria di eBook di esempio][11]

Il seguente codice Java analizza l’eBook EPUB e salva le immagini dell’eBook una per una sul disco.

// Analizza gli eBook per estrarre immagini da file PDF, EPUB, FB2, CHM in Java e salvarli su disco.
Parser parser = new Parser("ebook.epub");
// Estrai le immagini dall'eBook e salvale in formato JPEG.
Iterable<PageImageArea> images = parser.getImages();
ImageOptions options = new ImageOptions(ImageFormat.Jpeg);
int imageNumber = 0;
// Iterare sulle immagini estratte
for (PageImageArea image : images) {
    image.save(Constants.getOutputFilePath(String.format("%d.jpeg", imageNumber)), options);
    imageNumber++;
}
Immagine estratta dall'eBook EPUB

Di conseguenza, tutte le immagini verranno salvate nella posizione fornita. Ecco una delle immagini mostrate come esempio.

Le immagini possono essere salvate in uno qualsiasi dei seguenti formati di file immagine:

  • JPG
  • PNG
  • WEBP
  • GIF
  • BMP

Estrai immagini da PDF, FB2, eBook CHM in Java

Oltre al formato EPUB, se hai il tuo eBook in PDF, FB2, CHM o con un altro formato, puoi estrarre le loro immagini allo stesso modo. Basta passare il tuo eBook al costruttore Parser durante la creazione dell’oggetto. Successivamente, il metodo getImages estrarrà le immagini dagli eBook forniti utilizzando lo stesso codice Java.

// Provide different eBook formats to the Parser constructor to extract the images.
// Parser parser = new Parser("ebook.epub");
Parser parser = new Parser("ebook.pdf");
// Parser parser = new Parser("ebook.fb2");
// Parser parser = new Parser("ebook.chm");

Iterable<PageImageArea> images = parser.getImages();

Conclusione

In questo articolo, hai imparato a ottenere in modo programmatico tutte le immagini da PDF, EPUB, FB2, eBook CHM all’interno delle tue applicazioni Java. Ora puoi provare a creare la tua applicazione Java per l’estrazione di immagini utilizzando l’API GroupDocs.Parser for Java.

Per ulteriori informazioni sull’API, puoi visitare documentazione o esempi open source su GitHub. Per qualsiasi ulteriore problema, puoi contattare il supporto rapido al forum.

Guarda anche