eBooks van verschillende formaten zijn heel gebruikelijk in het dagelijks gebruik. Het eBook kan zowel tekst als afbeeldingen bevatten. Als u de afbeeldingen van een eBook ergens anders wilt gebruiken, kunt u deze eenvoudig programmatisch uit uw Java-toepassing halen. In dit artikel leert u automatiseren hoe u afbeeldingen kunt extraheren uit eBook-bestanden zoals EPUB, PDF, FB2, CHM in Java.
De volgende onderwerpen komen hieronder aan bod:
- Java API - Beeldextractie uit eBooks
- Extraheer afbeeldingen uit EPUB eBook in Java
- Extraheer afbeeldingen uit PDF, FB2, CHM eBooks in Java
Java API om afbeeldingen uit eBooks te extraheren
GroupDocs.Parser for Java API is een veelzijdige automatiserings-API voor het extraheren van afbeeldingen uit eBooks en documenten in Java. Daarnaast ondersteunt de API het parseren en extraheren van afbeeldingen, tekst en metadata uit tekstverwerkingsdocumenten, spreadsheets, pdf’s, presentaties, e-mails, ZIP-archieven en vele andere ondersteunde documentindelingen.
Downloaden en configureren
Download het JAR-bestand uit de downloads-sectie, of voeg gewoon de volgende pom.xml-configuratie toe aan uw op Maven gebaseerde Java-toepassingen om de onderstaande voorbeelden te proberen. Voor meer informatie kunt u de API-referentie bezoeken.
<repository>
<id>GroupDocsJavaAPI</id>
<name>GroupDocs Java API</name>
<url>http://repository.groupdocs.com/repo/</url>
</repository>
<dependency>
<groupId>com.groupdocs</groupId>
<artifactId>groupdocs-parser</artifactId>
<version>21.2</version>
</dependency>
Extraheer afbeeldingen uit EPUB eBook in Java
Laten we beginnen met het EPUB eBook om het te ontleden voor afbeeldingen. De volgende stappen parseren het EPUB eBook en extraheren alle afbeeldingen eruit met behulp van Java-code.
- Maak een klasseobject Parser met het eBook.
- Gebruik de methode getImages om alle afbeeldingen van het EPUB eBook te extraheren.
- Doorloop de geëxtraheerde afbeeldingen en sla ze op schijf op.
De volgende Java-code parseert het EPUB eBook en slaat de afbeeldingen van het eBook één voor één op de schijf op.
// Parseer eBooks om afbeeldingen uit PDF-, EPUB-, FB2-, CHM-bestanden in Java te extraheren en op schijf op te slaan.
Parser parser = new Parser("ebook.epub");
// Extraheer afbeeldingen uit eBook en sla ze op in JPEG-indeling.
Iterable<PageImageArea> images = parser.getImages();
ImageOptions options = new ImageOptions(ImageFormat.Jpeg);
int imageNumber = 0;
// Herhaal over geëxtraheerde afbeeldingen
for (PageImageArea image : images) {
image.save(Constants.getOutputFilePath(String.format("%d.jpeg", imageNumber)), options);
imageNumber++;
}
Als gevolg hiervan worden alle afbeeldingen opgeslagen op de opgegeven locatie. Hier is een van de getoonde afbeeldingen als voorbeeld.
De afbeeldingen kunnen worden opgeslagen in een van de volgende afbeeldingsbestandsindelingen:
- JPG
- PNG
- WEBP
- GIF
- BMP
Extraheer afbeeldingen uit PDF, FB2, CHM eBooks in Java
Naast het EPUB-formaat, als je je eBook in PDF, FB2, CHM of een ander formaat hebt, kun je hun afbeeldingen op dezelfde manier extraheren. Geef uw eBook gewoon door aan de Parser-constructor terwijl u het object maakt. Daarna haalt de getImages-methode afbeeldingen uit de door u geleverde eBooks met dezelfde Java-code.
// Provide different eBook formats to the Parser constructor to extract the images.
// Parser parser = new Parser("ebook.epub");
Parser parser = new Parser("ebook.pdf");
// Parser parser = new Parser("ebook.fb2");
// Parser parser = new Parser("ebook.chm");
Iterable<PageImageArea> images = parser.getImages();
Conclusie
In dit artikel hebt u geleerd hoe u alle afbeeldingen van PDF-, EPUB-, FB2- en CHM-eBooks programmatisch kunt ophalen in uw Java-toepassingen. Nu kunt u proberen uw eigen Java-toepassing voor het extraheren van afbeeldingen te bouwen met behulp van GroupDocs.Parser for Java API.
Ga voor meer informatie over de API naar documentatie of open-source voorbeelden op GitHub. Voor verdere problemen kunt u contact opnemen met de snelle ondersteuning op het forum.