En popüler dosya biçimlerinden biri olan PDF, hemen hemen her işletme ve endüstri tarafından kullanılmaktadır. PDF belgeleri, biçimlendirilmiş metin, resimler, açıklamalar vb. dahil olmak üzere çeşitli içerikler içerebilir. İçeriğin genellikle PDF dosyalarından çıkarılması gerekir. Bu makalede, Java’daki PDF belgelerinden programlı olarak görüntülerin nasıl çıkarılacağını tartışacağız.

PDF Dosyalarından Görüntüleri Çıkarmak için Java API

GroupDocs, PDF dosyalarından görüntülerin çıkarılması için Java geliştiricilerine GroupDocs.Parser sağlar. PDF dosyasının yanı sıra aynı API, kelime işlemci belgeleri, elektronik tablolar, e-Kitaplar, sunumlar, e-postalar, ZIP arşivleri ve [diğer birçok belge biçimi] gibi diğer çeşitli belge biçimlerinden görüntülerin ayıklanmasının yanı sıra ayrıştırılmasını da destekler. .

İndirin veya Yapılandırın

JAR dosyasını indirilenler bölümünden indirebilir veya maven tabanlı Java uygulamalarınızın pom.xml dosyası için depo ve bağımlılık yapılandırmalarını alabilirsiniz.

<repository>
    <id>groupdocs-artifacts-repository</id>
    <name>GroupDocs Artifacts Repository</name>
    <url>https://releases.groupdocs.com/java/repo/</url>
</repository>
<dependency>
    <groupId>com.groupdocs</groupId>
    <artifactId>groupdocs-parser</artifactId>
    <version>22.11</version>
</dependency>

Java’daki bir PDF belgesinden Görüntüleri Çıkarma Adımları

Aşağıda, birkaç satır Java kodu kullanarak PDF dosyasından nasıl resim alınacağını adım adım gösteren noktalar yer almaktadır.

  1. Yeni bir proje oluşturun.
  2. API’yi yukarıda belirtildiği gibi indirin veya en son API sürümüne güncelleyin.
  3. Aşağıdaki sınıfları içe aktarın:
import com.groupdocs.parser.Parser;
import com.groupdocs.parser.data.PageImageArea;
  1. Parser sınıfını kullanarak PDF belgesini yükleyin.
// PDF dosyasını yükle
try (Parser parser = new Parser("path/document.pdf")) {
    // Görüntü Çıkarma Kodu buraya gelir.
}
  1. GetImages yöntemini kullanarak tüm görüntüleri belgeden çıkarın.
// Yüklenen dosyadan Görüntüleri Çıkarın
Iterable<PageImageArea> images = parser.getImages();
  1. Koleksiyondaki her resme erişin ve kaydetme yöntemini kullanarak kaydedin.
// Dosyayı uzantılarıyla birlikte kaydedin
for (PageImageArea image : images)  {
    image.save(String.format("path/image_%d" + image.getFileType().getExtension(), imageCounter++));
}

Görüntüler PNG, JPG, BMP, WebP veya GIF gibi çeşitli farklı görüntü biçimlerinde kaydedilebilir.

Java Complete Code – PDF’den Görüntü Çıkarma

Sağlanan PDF dosyasından tüm görüntüleri almanızı sağlayan eksiksiz kaynak kodu buradadır.

// Java'daki PDF dosyasından Görüntüleri Çıkarın
try (Parser parser = new Parser("path/document.pdf")) 
{
    // Görüntüleri al
    Iterable<PageImageArea> images = parser.getImages();
    
    // Görüntü çıkarmanın desteklenip desteklenmediğini kontrol edin
    if (images == null) 
    {
        System.out.println("Images extraction isn't supported");
        return;
    }
    
    int imageCounter = 0;
    // Ayıklanan görüntüleri yineleyin
    for (PageImageArea image : images) 
    {
        image.save(String.format("path/image_%d" + image.getFileType().getExtension(), imageCounter++));
    }
}

Sonuçlar

Örnek PDF Belgesi

Ayıklanacak resimlerin bulunduğu PDF belgesi.

Çıkarılan Görüntüler

PDF'den ayıklanan görüntüler.

Gerekirse, [Java’da Bir PDF Belgesinin Herhangi Bir Belirli Sayfasından Görüntüleri Çıkartabileceğiniz] ayrı bir makalede ayrıca açıklanmaktadır.

Devamını oku

Belgelerini kullanarak veri çıkarma Java API’si hakkında daha fazlasını keşfedebilirsiniz. Sorularınızı forumumuz aracılığıyla bizimle paylaşabilirsiniz.

Ayrıca bakınız