Taşınabilir Belge Formatı (PDF), Adobe tarafından geliştirilen popüler ve yaygın olarak kullanılan bir belge formatıdır. PDF belgeleri, biçimlendirilmiş metin, resimler, ek açıklamalar, form alanları vb. dahil olmak üzere çeşitli içerikler içerebilir. PDF belgelerini programlı olarak ayrıştırmak popüler bir kullanım durumudur ve metni çıkarmanın birçok yolu vardır. Ancak, bir PDF belgesinden görüntü çıkarmak karmaşık bir iştir. Bu makale, C# dilinde programlı olarak PDF belgelerinden görüntüleri ne kadar kolay ayıklayabileceğinizi göstermektedir.

PDF Dosyalarından Görüntüleri Çıkarmak için .NET API

GroupDocs.Parser for .NET API, PDF dosyalarından görüntülerin çıkarılmasında rol oynayacaktır. API, PDF’nin yanı sıra kelime işlemci belgeleri, elektronik tablolar, e-Kitaplar, sunumlar, e-postalar, ZIP arşivleri ve [diğer birçok belge biçiminden] görüntülerin ayrıştırılmasını ve çıkarılmasını destekler.

İndirilenler bölümünden DLL’leri veya MSI yükleyicisini indirebilir veya NuGet yoluyla .NET uygulamanıza API’yi yükleyebilirsiniz.

PM> Install-Package GroupDocs.Parser

C# kullanarak bir PDF belgesinden Görüntüleri Çıkarma Adımları

Birkaç satırlık C# kodu kullanarak PDF dosyasından görüntülerin nasıl alınacağına adım adım hızlıca bakalım.

  1. Yeni bir proje oluşturun.
  2. API’yi yukarıda belirtildiği gibi indirin veya en son API sürümüne güncelleyin.
  3. Aşağıdaki ad alanlarını ekleyin:
using System;
using System.Collections.Generic;
using System.Text;
using GroupDocs.Parser.Data;
  1. Parser sınıfını kullanarak PDF belgesini yükleyin.
// Parser sınıfının bir örneğini oluşturun
using (Parser parser = new Parser("path/document.pdf"))
{
  // kodunuz buraya gelecek.
}
  1. GetImages yöntemini kullanarak görüntüleri belgeden çıkarın.
// Görüntüleri ayıklayın
IEnumerable<PageImageArea> images = parser.GetImages();

// Görüntü çıkarmanın desteklenip desteklenmediğini kontrol edin
if (images == null)
{
    Console.WriteLine("Images extraction isn't supported");
    return;
}
  1. Koleksiyondaki her görüntüye erişin ve Save yöntemini kullanarak kaydedin.
// Alınan görüntüler üzerinde yineleme yapın
foreach (PageImageArea image in images)
{
    // Görüntüleri Kaydet
    image.Save("imageFilePath/image-" + imageNumber.ToString() + ".jpeg", new ImageOptions(ImageFormat.Jpeg));
    imageNumber++;
}

Görüntüleri JPG, PNG, BMP, WebP veya GIF gibi çeşitli farklı görüntülerde kaydedebilirsiniz.

C# Tam Kod – PDF’den Görüntü Çıkarma

İşte tüm görüntüleri bir PDF dosyasından almanızı sağlayacak eksiksiz kod.

// C# kullanarak PDF'den görüntüleri ayıklayın
using (Parser parser = new Parser("path/document.pdf"))
{
    IEnumerable<PageImageArea> images = parser.GetImages();
    // Görüntü çıkarmanın desteklenip desteklenmediğini kontrol edin
    if (images == null) 
    {
        Console.WriteLine("Images extraction isn't supported");
        return;
    }
    
    ImageOptions options = new ImageOptions(ImageFormat.Jpeg);
    int imageNumber = 0;
    
    // Alınan görüntüler üzerinde yineleme yapın
    foreach (PageImageArea image in images)
    {
        // Görüntüleri Kaydet
        image.Save("imageFilePath/image-" + imageNumber.ToString() + ".jpeg", options);
        imageNumber++;
    }
}

Sonuçlar

Örnek PDF Belgesi

Ayıklanacak resimlerin bulunduğu PDF belgesi.

Çıkarılan Görüntüler

PDF'den ayıklanan görüntüler.

Gerekirse, nasıl [C# kullanarak bir PDF Belgesinin Herhangi Bir Belirli Sayfasından Görüntüleri Çıkartabileceğiniz] ayrı bir makalede ayrıca açıklanmaktadır.

Devamını oku

Belgelerini kullanarak .NET veri çıkarma API’si hakkında daha fazlasını keşfedebilirsiniz. Ayrıca, sorularınızı forumumuz aracılığıyla bizimle paylaşabilirsiniz.

Ayrıca bakınız