이 기사에서는 PDF 문서를 읽고 구문 분석한 다음 C#에서 프로그래밍 방식으로 PDF 양식 필드 값을 추출하는 방법을 배웁니다. 이전에 Java에서 PDF 형식에서 값을 추출하는 방법을 살펴보았습니다. 이 기사를 읽은 후 피드백 양식을 작성했다면 분석을 위해 .NET 및 Java 애플리케이션 내에서 값을 추출하거나 데이터베이스에 저장할 수 있습니다.

PDF 양식을 구문 분석하여 C#에서 값 추출

PDF 양식에서 값을 구문 분석하고 추출하는 .NET API

GroupDocs.Parser for .NET은 .NET 애플리케이션을 위한 사용하기 쉽고 강력한 구문 분석 및 데이터 추출 API입니다. 워드 프로세서 및 PDF 문서, 스프레드시트, 프레젠테이션, 이메일, 마크업, 전자책, 아카이브 등에서 텍스트, 메타데이터 및 이미지 추출을 지원합니다. 중요한 기능 중 하나는 아래에 표시될 것이며 작은 C# 코드를 사용하여 양식 필드 값을 추출하기 위해 채울 수 있는 PDF 양식을 구문 분석하는 것입니다.

API의 아래에 언급된 예제와 기타 예제를 테스트하려면 NuGet에서 API를 다운로드하여 설치하거나 GroupDocs 다운로드에서 직접 다운로드할 수 있습니다.

PM> Install-Package GroupDocs.Parser

C#을 사용하여 PDF 양식 필드에서 데이터 추출

다음의 간단한 단계는 PDF를 구문 분석한 다음 C#에서 PDF 양식 필드 값을 추출하는 방법을 알려줍니다.

  • Parser 클래스를 사용하여 PDF 파일을 로드합니다.
  • ParseForm 방법을 사용하여 PDF 양식을 구문 분석합니다.
  • 구문 분석된 컬렉션을 탐색하여 양식 필드 값을 추출합니다.

다음 C# 코드 예제는 .NET 응용 프로그램 내에서 채워진 PDF 양식의 필드 값 추출을 보여줍니다.

// 채워진 PDF 양식을 구문 분석하여 C#에서 필드 값 추출
using (Parser parser = new Parser("filePath/PDFForm.pdf"))
{
    // PDF 양식에서 데이터 추출
    DocumentData data = parser.ParseForm();
    // 추출된 PDF 양식 필드 데이터 반복
    for (int i = 0; i < data.Count; i++)
    {
        Console.Write(data[i].Name + ": ");
        PageTextArea area = data[i].PageArea as PageTextArea;
        Console.WriteLine(area == null ? "Not a template field" : area.Text);
    }
}
COMPANY: GroupDocs
EMAIL: everything@groupdocs.com
COUNTRY: Australia

결론

이제 PDF 파일을 구문 분석하고 채울 수 있는 PDF 양식 필드에서 값을 빠르고 정확하게 가져올 수 있는 .NET 기반 응용 프로그램을 개발하는 데 편안함을 느끼실 것이라고 확신합니다. 더 많은 기능을 추가하려면 문서 기사 및 GitHub의 C# 예제에서 API에 대해 자세히 알아볼 수 있습니다.

문의 및 빠른 답변은 포럼으로 연락주세요.

또한보십시오