در این مقاله یاد می گیریم که چگونه اسناد PDF را بخوانیم و تجزیه کنیم و سپس مقادیر فیلد فرم PDF را به صورت برنامه نویسی در C# استخراج کنیم. قبلاً [نحوه استخراج مقادیر از فرم‌های PDF در جاوا2 را دیده‌ایم. پس از خواندن این مقالات، اگر فرم های بازخورد را پر کرده اید، می توانید مقادیر موجود در برنامه های .NET و Java را برای تجزیه و تحلیل استخراج کرده یا در پایگاه داده ذخیره کنید.

تجزیه فرم های PDF برای استخراج مقادیر در سی شارپ

NET API برای تجزیه و استخراج مقادیر از فرم‌های PDF

GroupDocs.Parser for .NET یک API تجزیه و تحلیل و استخراج داده آسان و قدرتمند برای برنامه های NET است. از استخراج متن، فراداده و تصویر از اسناد پردازش کلمه و PDF، صفحات گسترده، ارائه ها، ایمیل ها، نشانه گذاری ها، کتاب های الکترونیکی، بایگانی ها و موارد دیگر پشتیبانی می کند. یکی از ویژگی های مهم که در زیر نیز نشان داده خواهد شد، تجزیه فرم های PDF قابل پر کردن برای استخراج مقادیر فیلد فرم با استفاده از یک قطعه کوچک کد C# است.

برای آزمایش نمونه‌های زیر و نمونه‌های دیگر API، می‌توانید API را از NuGet یا مستقیما دانلود از بارگیری‌های GroupDocs دانلود و نصب کنید.

PM> Install-Package GroupDocs.Parser

استخراج داده ها از فیلد فرم PDF با استفاده از سی شارپ

مراحل ساده زیر نحوه تجزیه PDF و سپس استخراج مقادیر فیلد فرم PDF در C# را نشان می دهد.

  • فایل PDF را با استفاده از کلاس Parser بارگیری کنید.
  • فرم PDF را با استفاده از روش ParseForm تجزیه کنید.
  • برای استخراج مقادیر فیلد فرم، مجموعه تجزیه شده را طی کنید.

مثال کد C# زیر استخراج مقادیر فیلد فرم‌های PDF پر شده در برنامه‌های NET را نشان می‌دهد.

// تجزیه فرم PDF پر شده برای استخراج مقادیر فیلد در سی شارپ
using (Parser parser = new Parser("filePath/PDFForm.pdf"))
{
    // استخراج داده ها از فرم PDF
    DocumentData data = parser.ParseForm();
    // روی داده های فیلدهای فرم PDF استخراج شده تکرار کنید
    for (int i = 0; i < data.Count; i++)
    {
        Console.Write(data[i].Name + ": ");
        PageTextArea area = data[i].PageArea as PageTextArea;
        Console.WriteLine(area == null ? "Not a template field" : area.Text);
    }
}
COMPANY: GroupDocs
EMAIL: everything@groupdocs.com
COUNTRY: Australia

نتیجه

من مطمئن هستم که اکنون در توسعه برنامه مبتنی بر .NET خود احساس راحتی می کنید که می تواند فایل های PDF را تجزیه کند و مقادیر را از فیلدهای فرم PDF قابل پرکردن به سرعت و دقیق واکشی کند. برای افزودن ویژگی‌های بیشتر، می‌توانید از مقاله‌های اسناد و نمونه‌های C# در GitHub درباره API اطلاعات بیشتری کسب کنید.

برای پرس و جو و پاسخ سریع، در [فروم 10 در تماس باشید.

همچنین ببینید