У цій статті ми навчимося читати та аналізувати PDF-документи, а потім програмно видобувати значення полів форми PDF у C#. Раніше ми бачили як витягувати значення з PDF-форм у Java. Після прочитання цих статей, якщо ви заповнили форми зворотнього зв’язку, ви можете витягнути значення у своїх програмах .NET і Java для аналізу або зберегти їх у базі даних.
.NET API для аналізу та вилучення значень із форм PDF
GroupDocs.Parser for .NET — це простий у використанні та потужний API для аналізу та вилучення даних для програм .NET. Він підтримує вилучення тексту, метаданих і зображень із текстових і PDF-документів, електронних таблиць, презентацій, електронних листів, розміток, електронних книг, архівів і багато іншого. Однією з важливих особливостей, яка також буде показана нижче, є аналіз заповнюваних PDF-форм для отримання значень полів форми за допомогою невеликого фрагмента коду C#.
Щоб перевірити наведені нижче та інші приклади API, ви можете завантажити та встановити API з NuGet або безпосередньо завантажити із завантажень GroupDocs.
PM> Install-Package GroupDocs.Parser
Витягти дані з поля форми PDF за допомогою C#
Наступні прості кроки пояснюють, як проаналізувати PDF, а потім витягти значення полів форми PDF у C#.
- Завантажте PDF-файл за допомогою класу Parser.
- Проаналізуйте форму PDF за допомогою методу ParseForm.
- Перегляньте проаналізовану колекцію, щоб отримати значення полів форми.
У наведеному нижче прикладі коду C# показано вилучення значень полів заповнених PDF-форм у програмах .NET.
// Проаналізуйте заповнену PDF-форму, щоб отримати значення полів у C#
using (Parser parser = new Parser("filePath/PDFForm.pdf"))
{
// Витягти дані з форми PDF
DocumentData data = parser.ParseForm();
// Переглядайте витягнуті дані полів форми PDF
for (int i = 0; i < data.Count; i++)
{
Console.Write(data[i].Name + ": ");
PageTextArea area = data[i].PageArea as PageTextArea;
Console.WriteLine(area == null ? "Not a template field" : area.Text);
}
}
COMPANY: GroupDocs
EMAIL: everything@groupdocs.com
COUNTRY: Australia
Висновок
Я впевнений, що тепер ви почуватиметеся комфортно, розробляючи власну програму на основі .NET, яка може швидко й точно аналізувати файли PDF і отримувати значення з полів форми PDF, які можна заповнити. Щоб додати додаткові функції, ви можете дізнатися більше про API зі статей документації та прикладів C# на GitHub.
Щоб отримати запитання та отримати швидку відповідь, зв’яжіться на форумі.