PDF, který je jedním z nejoblíbenějších formátů souborů, používá téměř každý podnik a průmysl. Dokumenty PDF mohou obsahovat různorodý obsah včetně formátovaného textu, obrázků, anotací atd. Často je nutné extrahovat obsah ze souborů PDF. Zde v tomto článku budeme diskutovat o tom, jak programově extrahovat obrázky z dokumentů PDF v Java.
Extrahujte obrázky z elektronických knih EPUB, FB2, CHM v Java
Elektronické knihy různých formátů jsou v každodenním používání velmi běžné. Elektronická kniha může obsahovat text i obrázky. Pokud chcete obrázky jakékoli elektronické knihy použít jinde, můžete je snadno získat programově ve své aplikaci Java. V tomto článku se naučíte automatizovat, jak extrahovat obrázky ze souborů e-knih, jako jsou EPUB, PDF, FB2, CHM v Java.
Extrahujte obrázky z dokumentů pomocí Java
Dnes se naučíme programově extrahovat obrázky z dokumentů PDF, Excel, PowerPoint a Word pomocí Javy. Pro extrakci obrázků použijeme [GroupDocs.Parser for Java][1]. Toto Java API podporuje analýzu dokumentů a extrakci obrázků, textu a metadat z textových dokumentů, tabulek, prezentací, archivů a e-mailových dokumentů. Extrahované obrázky lze uložit ve formátech BMP, GIF, JPEG, PNG a WebP.