Bu makalede, PDF belgelerini okumayı ve ayrıştırmayı ve ardından C# dilinde programlı olarak PDF form alanı değerlerini çıkarmayı öğreneceğiz. Daha önce [Java’da PDF formlarından değerlerin nasıl çıkarılacağını] gördük2. Bu makaleleri okuduktan sonra, geri bildirim formlarını doldurduysanız, .NET & Java uygulamalarınızdaki değerleri analiz için çıkarabilir veya veritabanına kaydedebilirsiniz.

C#'ta değerleri Ayıklamak için PDF Formlarını Ayrıştırın

PDF Formlarından Değerleri Ayrıştırmak ve Çıkarmak için .NET API

GroupDocs.Parser for .NET, .NET uygulamaları için kullanımı kolay, güçlü bir ayrıştırma ve veri çıkarma API’sidir. Kelime işlemci ve PDF belgelerinden, elektronik tablolardan, sunumlardan, e-postalardan, işaretlemelerden, e-kitaplardan, arşivlerden ve çok daha fazlasından metin, meta veri ve görüntü çıkarmayı destekler. Aşağıda da gösterilecek olan önemli özelliklerden biri, küçük bir C# kodu kullanarak form alanı değerlerini çıkarmak için doldurulabilir PDF formlarının ayrıştırılmasıdır.

API’nin aşağıda belirtilen ve diğer örneklerini test etmek için API’yi NuGet’ten veya doğrudan GroupDocs indirmelerinden indir indirip yükleyebilirsiniz.

PM> Install-Package GroupDocs.Parser

C# kullanarak PDF Form Alanından Veri Çıkarma

Aşağıdaki basit adımlar, PDF’nin nasıl ayrıştırılacağını ve ardından C#’ta PDF form alanı değerlerinin nasıl çıkarılacağını anlatır.

  • Parser sınıfını kullanarak PDF dosyasını yükleyin.
  • ParseForm yöntemini kullanarak PDF formunu ayrıştırın.
  • Form alanı değerlerini ayıklamak için ayrıştırılmış koleksiyonu çaprazlayın.

Aşağıdaki C# kod örneği, .NET uygulamalarında doldurulmuş PDF formlarının alan değerlerinin çıkarılmasını gösterir.

// C#'ta alan değerlerini ayıklamak için doldurulmuş PDF Formunu ayrıştırın
using (Parser parser = new Parser("filePath/PDFForm.pdf"))
{
    // PDF Formundan veri ayıklayın
    DocumentData data = parser.ParseForm();
    // Ayıklanan PDF Form alanları verilerini yineleyin
    for (int i = 0; i < data.Count; i++)
    {
        Console.Write(data[i].Name + ": ");
        PageTextArea area = data[i].PageArea as PageTextArea;
        Console.WriteLine(area == null ? "Not a template field" : area.Text);
    }
}
COMPANY: GroupDocs
EMAIL: everything@groupdocs.com
COUNTRY: Australia

Çözüm

Artık PDF dosyalarını ayrıştırabilen ve doldurulabilir PDF form alanlarından değerleri hızlı ve hassas bir şekilde getirebilen kendi .NET tabanlı uygulamanızı geliştirirken kendinizi rahat hissedeceğinizden eminim. Daha fazla özellik eklemek için documentation makalelerinden ve GitHub‘daki C# örneklerinden API hakkında daha fazla bilgi edinebilirsiniz.

Sorgular ve hızlı yanıt için forumda iletişim halinde olun.

Ayrıca bakınız