eBooks in verschiedenen Formaten sind im alltäglichen Gebrauch weit verbreitet. Das eBook kann sowohl Text als auch Bilder enthalten. Wenn Sie die Bilder eines beliebigen eBooks anderweitig verwenden möchten, können Sie diese einfach programmgesteuert in Ihrer Java-Anwendung extrahieren. In diesem Artikel erfahren Sie, wie Sie Bilder aus eBook-Dateien wie EPUB, PDF, FB2, CHM in Java automatisieren extrahieren.
Nachfolgend werden folgende Themen behandelt:
- Java API - Bildextraktion aus eBooks
- Bilder aus EPUB-eBook in Java extrahieren
- Bilder aus PDF-, FB2-, CHM-eBooks in Java extrahieren
Java-API zum Extrahieren von Bildern aus eBooks
GroupDocs.Parser for Java API ist eine funktionsreiche Automatisierungs-API zum Extrahieren von Bildern aus eBooks und Dokumenten in Java. Darüber hinaus unterstützt die API das Parsen und Extrahieren von Bildern, Text und Metadaten aus Textverarbeitungsdokumenten, Tabellenkalkulationen, PDF, Präsentationen, E-Mails, ZIP-Archiven und vielen anderen unterstützten Dokumentformaten.
Herunterladen und konfigurieren
Holen Sie sich die JAR-Datei aus dem Abschnitt downloads oder fügen Sie einfach die folgende pom.xml-Konfiguration zu Ihren Maven-basierten Java-Anwendungen hinzu, um die unten aufgeführten Beispiele auszuprobieren. Einzelheiten finden Sie in der API-Referenz.
<repository>
<id>GroupDocsJavaAPI</id>
<name>GroupDocs Java API</name>
<url>http://repository.groupdocs.com/repo/</url>
</repository>
<dependency>
<groupId>com.groupdocs</groupId>
<artifactId>groupdocs-parser</artifactId>
<version>21.2</version>
</dependency>
Bilder aus EPUB-eBooks in Java extrahieren
Beginnen wir mit dem EPUB-eBook, um es nach Bildern zu durchsuchen. Die folgenden Schritte analysieren das EPUB-eBook und extrahieren alle Bilder daraus mithilfe von Java-Code.
- Erstellen Sie ein Parser-Klassenobjekt mit dem eBook.
- Verwenden Sie die Methode getImages, um alle Bilder des EPUB-eBooks zu extrahieren.
- Durchlaufen Sie die extrahierten Bilder und speichern Sie sie auf der Festplatte.
Der folgende Java-Code analysiert das EPUB-eBook und speichert die Bilder des eBooks einzeln auf der Festplatte.
// Analysieren Sie eBooks, um Bilder aus PDF-, EPUB-, FB2- und CHM-Dateien in Java zu extrahieren und auf der Festplatte zu speichern.
Parser parser = new Parser("ebook.epub");
// Bilder aus eBook extrahieren und im JPEG-Format speichern.
Iterable<PageImageArea> images = parser.getImages();
ImageOptions options = new ImageOptions(ImageFormat.Jpeg);
int imageNumber = 0;
// Über extrahierte Bilder iterieren
for (PageImageArea image : images) {
image.save(Constants.getOutputFilePath(String.format("%d.jpeg", imageNumber)), options);
imageNumber++;
}
Als Ergebnis werden alle Bilder am angegebenen Ort gespeichert. Hier ist eines der gezeigten Bilder als Beispiel.
Die Bilder können in einem der folgenden Bilddateiformate gespeichert werden:
- JPG
- PNG
- WEBP
- GIF
- BMP
Extrahieren Sie Bilder aus PDF-, FB2- und CHM-eBooks in Java
Wenn Sie Ihr eBook zusätzlich zum EPUB-Format im PDF-, FB2-, CHM- oder einem anderen Format haben, können Sie dessen Bilder auf die gleiche Weise extrahieren. Übergeben Sie Ihr eBook einfach an den Parser-Konstruktor, während Sie das Objekt erstellen. Danach extrahiert die getImages-Methode Bilder aus Ihren bereitgestellten eBooks mit demselben Java-Code.
// Provide different eBook formats to the Parser constructor to extract the images.
// Parser parser = new Parser("ebook.epub");
Parser parser = new Parser("ebook.pdf");
// Parser parser = new Parser("ebook.fb2");
// Parser parser = new Parser("ebook.chm");
Iterable<PageImageArea> images = parser.getImages();
Fazit
In diesem Artikel haben Sie gelernt, alle Bilder aus PDF-, EPUB-, FB2- und CHM-eBooks programmgesteuert in Ihren Java-Anwendungen abzurufen. Jetzt können Sie versuchen, Ihre eigene Java-Anwendung zum Extrahieren von Bildern mithilfe der API GroupDocs.Parser for Java zu erstellen.
Weitere Informationen zur API finden Sie unter Dokumentation oder Open-Source-Beispiele auf GitHub. Bei weiteren Problemen können Sie sich an den schnellen Support im Forum wenden.