Bir programcı olarak, genellikle çeşitli türde belgelerden çıkarılan metni alma gereksinimi duyarız. Daha önce belgelerdeki kelimeleri saymayı, ZIP arşivlerini çıkarmayı, e-Kitaplardan görüntüleri çıkarmayı ve PDF form alanlarını ayrıştırmayı tartışmıştık. Bugün, bu makalede, C# kullanarak Markdown dosyalarından metin ayrıştırmayı ve ayıklamayı öğreneceksiniz.

C#.jpg kullanarak MD dosyalarından metin ayıklayın

Markdown Metin Çıkarma için .NET API

GroupDocs, belgeleri ayrıştırmak ve .NET uygulamaları içindeki çeşitli belge biçimlerinden metin çıkarmak için .NET API’sini sağlar. Bu makalede, C# kullanarak MD dosyalarından metin ayıklamak için GroupDocs.Parser for .NET‘i kullanacağız.

Ek olarak API, kelime işlemci belgeleri (DOC, DOCX, …), elektronik tablolar (XLS, XLSX, …), sunumlar (PPT, PPTX, …), e-Kitaplar (EPUB, FB2, …) gibi diğer birçok dosya biçiminin ayrıştırılmasını destekler. , barkod görüntüleri (JPG, PNG, …) ve belgelerinde belirtilen diğer pek çok şey.

DLL’leri veya MSI yükleyicisini indirilenler bölümünden indirebilir veya API’yi NuGet aracılığıyla .NET uygulamanıza yükleyebilirsiniz.

PM> Install-Package GroupDocs.Parser

C#‘daki Markdown Dosyasından Metni Çıkarın

Aşağıdakiler, C# kullanarak işaretleme dosyasından tüm metin içeriğini ayıklama adımlarıdır.

  • Parser sınıfını kullanarak MD dosyasını yükleyin.
  • GetText yöntemini kullanarak tüm metni TextReader’a çıkarın.
  • Metni istediğiniz gibi kullanın.

Aşağıdaki C# kaynak kodu, MD dosyasının metin içeriğini çıkarır.

// Markdown dosyasının tüm metnini çıkarın
using (Parser parser = new Parser("/path/document.md"))
{
    using (TextReader reader = parser.GetText())
    {
        Console.WriteLine(reader.ReadToEnd());
    }
}

Ücretsiz API Lisansı Alın

API’yi değerlendirme sınırlamaları olmadan kullanmak için ücretsiz bir geçici lisans alabilirsiniz.

Çözüm

Özetlemek gerekirse, C#‘daki markdown dosyalarından nasıl metin çıkarılacağını bir örnekle tartıştık. Bu, GroupDocs tarafından geliştirilen Çevrimiçi Belge Ayrıştırıcı gibi kendi metin çıkarma veya belge ayrıştırma uygulamanızı geliştirmeniz için size rehberlik etmiş olabilir.

Belgelerini kullanarak .NET API’sini ayrıştıran belge hakkında daha fazla bilgi edinebilirsiniz. Öğrenmenin en iyi yolu, GitHub üzerinde bulunan örnekleri deneyimlemektir. Herhangi bir sorunuz için forum aracılığıyla bize ulaşın.

Ayrıca bakınız