Sebagai seorang programmer, kita sering memiliki persyaratan untuk mengekstraksi teks dari berbagai jenis dokumen. Sebelumnya kita telah membahas menghitung kata dalam dokumen, mengekstrak arsip ZIP, mengekstrak gambar dari eBook, dan mem-parsing kolom formulir PDF. Hari ini, dalam artikel ini, Anda akan belajar cara mem-parsing dan mengekstrak teks dari file Markdown menggunakan C#.

Ekstrak teks dari file MD menggunakan C#.jpg

.NET API untuk Ekstraksi Teks Markdown

GroupDocs menyediakan .NET API untuk mengurai dokumen dan mengekstrak teks dari berbagai format dokumen dalam aplikasi .NET. Pada artikel ini, kita akan menggunakan GroupDocs.Parser for .NET untuk mengekstrak teks dari file MD menggunakan C#.

Selain itu, API mendukung penguraian banyak format file lain seperti dokumen pengolah kata (DOC, DOCX, …), spreadsheet (XLS, XLSX, …), presentasi (PPT, PPTX, …), eBook (EPUB, FB2, …) , gambar kode batang (JPG, PNG, …), dan banyak lainnya yang disebutkan dalam dokumentasinya.

Anda dapat mengunduh penginstal DLL atau MSI dari bagian unduhan atau menginstal API di aplikasi .NET Anda melalui NuGet.

PM> Install-Package GroupDocs.Parser

Ekstrak Teks dari File Markdown di C#

Berikut ini adalah langkah-langkah untuk mengekstrak seluruh konten teks dari file markdown menggunakan C#.

  • Muat file MD menggunakan kelas Parser.
  • Ekstrak seluruh teks ke dalam TextReader menggunakan metode GetText.
  • Gunakan teks sesuai keinginan.

Kode sumber C# berikut mengekstrak konten tekstual dari berkas MD.

// Ekstrak seluruh Teks dari file Markdown
using (Parser parser = new Parser("/path/document.md"))
{
    using (TextReader reader = parser.GetText())
    {
        Console.WriteLine(reader.ReadToEnd());
    }
}

Dapatkan Lisensi API Gratis

Anda bisa mendapatkan lisensi sementara gratis untuk menggunakan API tanpa batasan evaluasi.

Kesimpulan

Singkatnya, kami membahas cara mengekstrak teks dari file markdown di C# dengan sebuah contoh. Ini mungkin memandu Anda untuk mengembangkan aplikasi pengurai teks atau pengurai dokumen Anda sendiri seperti Pengurai Dokumen Online yang dikembangkan oleh GroupDocs.

Anda dapat mempelajari lebih lanjut tentang penguraian dokumen .NET API menggunakan dokumentasi. Cara terbaik untuk belajar adalah dengan mencoba contoh yang tersedia di GitHub. Hubungi kami untuk pertanyaan apa pun melalui forum.

Lihat juga