Pada artikel ini, kita akan belajar cara membaca dan mem-parsing dokumen PDF dan kemudian secara terprogram mengekstrak nilai bidang formulir PDF di C#. Sebelumnya, kita telah melihat cara mengekstrak nilai dari formulir PDF di Java. Setelah membaca artikel ini, jika Anda telah mengisi formulir umpan balik, Anda dapat mengekstrak nilai dalam aplikasi .NET & Java untuk dianalisis atau menyimpannya di database.

Parsing Formulir PDF untuk Mengekstrak nilai dalam C#

.NET API untuk Mengurai dan Mengekstrak Nilai dari Formulir PDF

GroupDocs.Parser for .NET adalah API penguraian dan ekstraksi data yang mudah digunakan dan kuat untuk aplikasi .NET. Ini mendukung ekstraksi teks, metadata, dan gambar dari pengolah kata dan dokumen PDF, spreadsheet, presentasi, email, markup, ebook, arsip, dan banyak lagi. Salah satu fitur penting dan juga akan ditampilkan di bawah ini adalah penguraian formulir PDF yang dapat diisi untuk mengekstrak nilai kolom formulir menggunakan potongan kecil kode C#.

Untuk menguji contoh API yang disebutkan di bawah dan lainnya, Anda dapat mengunduh dan menginstal API dari NuGet atau langsung unduh dari unduhan GroupDocs.

PM> Install-Package GroupDocs.Parser

Ekstrak Data dari Bidang Formulir PDF menggunakan C#

Langkah-langkah sederhana berikut memberi tahu cara mem-parsing PDF dan kemudian mengekstrak nilai bidang formulir PDF di C#.

  • Muat file PDF menggunakan kelas Parser.
  • Parsing formulir PDF menggunakan metode ParseForm.
  • Lintasi koleksi yang diurai untuk mengekstrak nilai bidang formulir.

Contoh kode C# berikut menunjukkan ekstraksi nilai bidang formulir PDF yang diisi dalam aplikasi .NET.

// Parsing Formulir PDF yang telah diisi untuk mengekstrak nilai bidang dalam C#
using (Parser parser = new Parser("filePath/PDFForm.pdf"))
{
    // Ekstrak data dari Formulir PDF
    DocumentData data = parser.ParseForm();
    // Ulangi data bidang Formulir PDF yang diekstraksi
    for (int i = 0; i < data.Count; i++)
    {
        Console.Write(data[i].Name + ": ");
        PageTextArea area = data[i].PageArea as PageTextArea;
        Console.WriteLine(area == null ? "Not a template field" : area.Text);
    }
}
COMPANY: GroupDocs
EMAIL: everything@groupdocs.com
COUNTRY: Australia

Kesimpulan

Saya yakin, Anda sekarang akan merasa nyaman dalam mengembangkan aplikasi berbasis .NET Anda sendiri yang dapat mengurai file PDF dan mengambil nilai dari kolom formulir PDF yang dapat diisi dengan cepat dan tepat. Untuk menambahkan lebih banyak fitur, Anda dapat mempelajari API lebih lanjut dari artikel dokumentasi dan contoh C# di GitHub.

Untuk pertanyaan dan tanggapan cepat, hubungi forum.

Lihat juga