במאמר זה, נלמד כיצד לקרוא ולנתח מסמכי PDF ולאחר מכן לחלץ באופן פרוגרמטי ערכי שדות PDF ב-C#. קודם לכן, ראינו כיצד לחלץ ערכים מטפסי PDF ב-Java. לאחר קריאת מאמרים אלה, אם מילאת טפסי משוב, תוכל לחלץ את הערכים בתוך יישומי .NET ו-Java שלך לניתוח או לשמור אותם במסד הנתונים.
.NET API לניתוח וחילוץ ערכים מטפסי PDF
GroupDocs.Parser for .NET הוא ממשק API לניתוח וחילוץ נתונים קל לשימוש וחזק עבור יישומי NET. הוא תומך בחילוץ טקסט, מטא נתונים ותמונה ממסמכי עיבוד תמלילים ו-PDF, גיליונות אלקטרוניים, מצגות, מיילים, סימון, ספרים אלקטרוניים, ארכיונים ועוד הרבה יותר. אחת התכונות המשמעותיות שיוצגו גם להלן היא ניתוח טופסי PDF הניתנים למילוי כדי לחלץ את ערכי שדות הטופס באמצעות חתיכה קטנה של קוד C#.
כדי לבדוק את הדוגמאות המוזכרות להלן ואחרות של ה-API, אתה יכול להוריד ולהתקין את ה-API מ-NuGet או ישירות הורד מהורדות של GroupDocs.
PM> Install-Package GroupDocs.Parser
חלץ נתונים משדה טופס PDF באמצעות C#
השלבים הפשוטים הבאים מספרים כיצד לנתח PDF ולאחר מכן לחלץ ערכי שדות PDF ב-C#.
- טען את קובץ ה-PDF באמצעות המחלקה Parser.
- נתח את טופס ה-PDF בשיטת ParseForm.
- חצו את האוסף המנתח כדי לחלץ את ערכי שדות הטופס.
דוגמה הבאה של קוד C# מציגה את החילוץ של ערכי שדות של טפסי PDF מלאים בתוך יישומי NET.
// נתח את טופס ה-PDF המלא כדי לחלץ ערכי שדות ב-C#
using (Parser parser = new Parser("filePath/PDFForm.pdf"))
{
// חלץ נתונים מטופס PDF
DocumentData data = parser.ParseForm();
// חזור על נתוני שדות טופס ה-PDF שחולצו
for (int i = 0; i < data.Count; i++)
{
Console.Write(data[i].Name + ": ");
PageTextArea area = data[i].PageArea as PageTextArea;
Console.WriteLine(area == null ? "Not a template field" : area.Text);
}
}
COMPANY: GroupDocs
EMAIL: everything@groupdocs.com
COUNTRY: Australia
סיכום
אני סמוך ובטוח שכעת תרגיש בנוח בפיתוח יישום מבוסס NET משלך שיכול לנתח קבצי PDF ולהביא ערכים משדות טופס PDF הניתנים למילוי במהירות ובדייקנות. כדי להוסיף תכונות נוספות, תוכל ללמוד עוד על ה-API מהמאמרים תיעוד ודוגמאות C# ב-GitHub.
לשאלות ומענה מהיר, צור קשר בפורום.