En popüler dosya biçimlerinden biri olan PDF, hemen hemen her işletme ve endüstri tarafından kullanılmaktadır. PDF belgeleri, biçimlendirilmiş metin, resimler, açıklamalar vb. dahil olmak üzere çeşitli içerikler içerebilir. İçeriğin genellikle PDF dosyalarından çıkarılması gerekir. Bu makalede, Java’daki PDF belgelerinden programlı olarak görüntülerin nasıl çıkarılacağını tartışacağız.
PDF Dosyalarından Görüntüleri Çıkarmak için Java API
GroupDocs, PDF dosyalarından görüntülerin çıkarılması için Java geliştiricilerine GroupDocs.Parser sağlar. PDF dosyasının yanı sıra aynı API, kelime işlemci belgeleri, elektronik tablolar, e-Kitaplar, sunumlar, e-postalar, ZIP arşivleri ve [diğer birçok belge biçimi] gibi diğer çeşitli belge biçimlerinden görüntülerin ayıklanmasının yanı sıra ayrıştırılmasını da destekler. .
İndirin veya Yapılandırın
JAR dosyasını indirilenler bölümünden indirebilir veya maven tabanlı Java uygulamalarınızın pom.xml dosyası için depo ve bağımlılık yapılandırmalarını alabilirsiniz.
<repository>
<id>groupdocs-artifacts-repository</id>
<name>GroupDocs Artifacts Repository</name>
<url>https://releases.groupdocs.com/java/repo/</url>
</repository>
<dependency>
<groupId>com.groupdocs</groupId>
<artifactId>groupdocs-parser</artifactId>
<version>22.11</version>
</dependency>
Java’daki bir PDF belgesinden Görüntüleri Çıkarma Adımları
Aşağıda, birkaç satır Java kodu kullanarak PDF dosyasından nasıl resim alınacağını adım adım gösteren noktalar yer almaktadır.
- Yeni bir proje oluşturun.
- API’yi yukarıda belirtildiği gibi indirin veya en son API sürümüne güncelleyin.
- Aşağıdaki sınıfları içe aktarın:
import com.groupdocs.parser.Parser;
import com.groupdocs.parser.data.PageImageArea;
- Parser sınıfını kullanarak PDF belgesini yükleyin.
// PDF dosyasını yükle
try (Parser parser = new Parser("path/document.pdf")) {
// Görüntü Çıkarma Kodu buraya gelir.
}
- GetImages yöntemini kullanarak tüm görüntüleri belgeden çıkarın.
// Yüklenen dosyadan Görüntüleri Çıkarın
Iterable<PageImageArea> images = parser.getImages();
- Koleksiyondaki her resme erişin ve kaydetme yöntemini kullanarak kaydedin.
// Dosyayı uzantılarıyla birlikte kaydedin
for (PageImageArea image : images) {
image.save(String.format("path/image_%d" + image.getFileType().getExtension(), imageCounter++));
}
Görüntüler PNG, JPG, BMP, WebP veya GIF gibi çeşitli farklı görüntü biçimlerinde kaydedilebilir.
Java Complete Code – PDF’den Görüntü Çıkarma
Sağlanan PDF dosyasından tüm görüntüleri almanızı sağlayan eksiksiz kaynak kodu buradadır.
// Java'daki PDF dosyasından Görüntüleri Çıkarın
try (Parser parser = new Parser("path/document.pdf"))
{
// Görüntüleri al
Iterable<PageImageArea> images = parser.getImages();
// Görüntü çıkarmanın desteklenip desteklenmediğini kontrol edin
if (images == null)
{
System.out.println("Images extraction isn't supported");
return;
}
int imageCounter = 0;
// Ayıklanan görüntüleri yineleyin
for (PageImageArea image : images)
{
image.save(String.format("path/image_%d" + image.getFileType().getExtension(), imageCounter++));
}
}
Sonuçlar
Örnek PDF Belgesi
Çıkarılan Görüntüler
Gerekirse, [Java’da Bir PDF Belgesinin Herhangi Bir Belirli Sayfasından Görüntüleri Çıkartabileceğiniz] ayrı bir makalede ayrıca açıklanmaktadır.
Devamını oku
Belgelerini kullanarak veri çıkarma Java API’si hakkında daha fazlasını keşfedebilirsiniz. Sorularınızı forumumuz aracılığıyla bizimle paylaşabilirsiniz.