در این مقاله یاد می گیریم که چگونه اسناد PDF را بخوانیم و تجزیه کنیم و سپس مقادیر فیلد فرم PDF را به صورت برنامه نویسی در C# استخراج کنیم. قبلاً [نحوه استخراج مقادیر از فرمهای PDF در جاوا2 را دیدهایم. پس از خواندن این مقالات، اگر فرم های بازخورد را پر کرده اید، می توانید مقادیر موجود در برنامه های .NET و Java را برای تجزیه و تحلیل استخراج کرده یا در پایگاه داده ذخیره کنید.
NET API برای تجزیه و استخراج مقادیر از فرمهای PDF
GroupDocs.Parser for .NET یک API تجزیه و تحلیل و استخراج داده آسان و قدرتمند برای برنامه های NET است. از استخراج متن، فراداده و تصویر از اسناد پردازش کلمه و PDF، صفحات گسترده، ارائه ها، ایمیل ها، نشانه گذاری ها، کتاب های الکترونیکی، بایگانی ها و موارد دیگر پشتیبانی می کند. یکی از ویژگی های مهم که در زیر نیز نشان داده خواهد شد، تجزیه فرم های PDF قابل پر کردن برای استخراج مقادیر فیلد فرم با استفاده از یک قطعه کوچک کد C# است.
برای آزمایش نمونههای زیر و نمونههای دیگر API، میتوانید API را از NuGet یا مستقیما دانلود از بارگیریهای GroupDocs دانلود و نصب کنید.
PM> Install-Package GroupDocs.Parser
استخراج داده ها از فیلد فرم PDF با استفاده از سی شارپ
مراحل ساده زیر نحوه تجزیه PDF و سپس استخراج مقادیر فیلد فرم PDF در C# را نشان می دهد.
- فایل PDF را با استفاده از کلاس Parser بارگیری کنید.
- فرم PDF را با استفاده از روش ParseForm تجزیه کنید.
- برای استخراج مقادیر فیلد فرم، مجموعه تجزیه شده را طی کنید.
مثال کد C# زیر استخراج مقادیر فیلد فرمهای PDF پر شده در برنامههای NET را نشان میدهد.
// تجزیه فرم PDF پر شده برای استخراج مقادیر فیلد در سی شارپ
using (Parser parser = new Parser("filePath/PDFForm.pdf"))
{
// استخراج داده ها از فرم PDF
DocumentData data = parser.ParseForm();
// روی داده های فیلدهای فرم PDF استخراج شده تکرار کنید
for (int i = 0; i < data.Count; i++)
{
Console.Write(data[i].Name + ": ");
PageTextArea area = data[i].PageArea as PageTextArea;
Console.WriteLine(area == null ? "Not a template field" : area.Text);
}
}
COMPANY: GroupDocs
EMAIL: everything@groupdocs.com
COUNTRY: Australia
نتیجه
من مطمئن هستم که اکنون در توسعه برنامه مبتنی بر .NET خود احساس راحتی می کنید که می تواند فایل های PDF را تجزیه کند و مقادیر را از فیلدهای فرم PDF قابل پرکردن به سرعت و دقیق واکشی کند. برای افزودن ویژگیهای بیشتر، میتوانید از مقالههای اسناد و نمونههای C# در GitHub درباره API اطلاعات بیشتری کسب کنید.
برای پرس و جو و پاسخ سریع، در [فروم 10 در تماس باشید.