У цій статті ми навчимося читати та аналізувати PDF-документи, а потім програмно видобувати значення полів форми PDF у C#. Раніше ми бачили як витягувати значення з PDF-форм у Java. Після прочитання цих статей, якщо ви заповнили форми зворотнього зв’язку, ви можете витягнути значення у своїх програмах .NET і Java для аналізу або зберегти їх у базі даних.

Аналіз PDF-форм для вилучення значень у C#

.NET API для аналізу та вилучення значень із форм PDF

GroupDocs.Parser for .NET — це простий у використанні та потужний API для аналізу та вилучення даних для програм .NET. Він підтримує вилучення тексту, метаданих і зображень із текстових і PDF-документів, електронних таблиць, презентацій, електронних листів, розміток, електронних книг, архівів і багато іншого. Однією з важливих особливостей, яка також буде показана нижче, є аналіз заповнюваних PDF-форм для отримання значень полів форми за допомогою невеликого фрагмента коду C#.

Щоб перевірити наведені нижче та інші приклади API, ви можете завантажити та встановити API з NuGet або безпосередньо завантажити із завантажень GroupDocs.

PM> Install-Package GroupDocs.Parser

Витягти дані з поля форми PDF за допомогою C#

Наступні прості кроки пояснюють, як проаналізувати PDF, а потім витягти значення полів форми PDF у C#.

  • Завантажте PDF-файл за допомогою класу Parser.
  • Проаналізуйте форму PDF за допомогою методу ParseForm.
  • Перегляньте проаналізовану колекцію, щоб отримати значення полів форми.

У наведеному нижче прикладі коду C# показано вилучення значень полів заповнених PDF-форм у програмах .NET.

// Проаналізуйте заповнену PDF-форму, щоб отримати значення полів у C#
using (Parser parser = new Parser("filePath/PDFForm.pdf"))
{
    // Витягти дані з форми PDF
    DocumentData data = parser.ParseForm();
    // Переглядайте витягнуті дані полів форми PDF
    for (int i = 0; i < data.Count; i++)
    {
        Console.Write(data[i].Name + ": ");
        PageTextArea area = data[i].PageArea as PageTextArea;
        Console.WriteLine(area == null ? "Not a template field" : area.Text);
    }
}
COMPANY: GroupDocs
EMAIL: everything@groupdocs.com
COUNTRY: Australia

Висновок

Я впевнений, що тепер ви почуватиметеся комфортно, розробляючи власну програму на основі .NET, яка може швидко й точно аналізувати файли PDF і отримувати значення з полів форми PDF, які можна заповнити. Щоб додати додаткові функції, ви можете дізнатися більше про API зі статей документації та прикладів C# на GitHub.

Щоб отримати запитання та отримати швидку відповідь, зв’яжіться на форумі.

Дивись також