PDF, který je jedním z nejoblíbenějších formátů souborů, používá téměř každý podnik a průmysl. Dokumenty PDF mohou obsahovat různorodý obsah včetně formátovaného textu, obrázků, anotací atd. Často je nutné extrahovat obsah ze souborů PDF. Zde v tomto článku budeme diskutovat o tom, jak programově extrahovat obrázky z dokumentů PDF v Java.
Extrahujte obrázky z dokumentů pomocí Java
Dnes se naučíme programově extrahovat obrázky z dokumentů PDF, Excel, PowerPoint a Word pomocí Javy. Pro extrakci obrázků použijeme [GroupDocs.Parser for Java][1]. Toto Java API podporuje analýzu dokumentů a extrakci obrázků, textu a metadat z textových dokumentů, tabulek, prezentací, archivů a e-mailových dokumentů. Extrahované obrázky lze uložit ve formátech BMP, GIF, JPEG, PNG a WebP.