بصفتنا مبرمجًا ، غالبًا ما يكون لدينا متطلب لاستخراج النص من أنواع مختلفة من المستندات. لقد ناقشنا سابقًا عد الكلمات في المستندات ، واستخراج أرشيفات ZIP ، واستخراج الصور من الكتب الإلكترونية ، وتحليل حقول نموذج PDF. اليوم ، في هذه المقالة ، ستتعلم كيفية تحليل واستخراج النص من ملفات Markdown باستخدام C#.

استخراج النص من ملفات MD باستخدام C# .jpg

.NET API لاستخراج نص Markdown

يوفر GroupDocs .NET API الخاص به لتحليل المستندات واستخراج النص من تنسيقات المستندات المختلفة داخل تطبيقات .NET. في هذه المقالة ، سنستخدم GroupDocs.Parser for .NET لاستخراج النص من ملفات MD باستخدام C#.

بالإضافة إلى ذلك ، تدعم واجهة برمجة التطبيقات تحليل العديد من تنسيقات الملفات الأخرى مثل مستندات معالجة الكلمات (DOC ، DOCX ، …) ، جداول البيانات (XLS ، XLSX ، …) ، العروض التقديمية (PPT ، PPTX ، …) ، الكتب الإلكترونية (EPUB ، FB2 ، …) وصور الباركود (JPG ، PNG ، …) والعديد من الصور الأخرى المذكورة في وثائقها.

يمكنك تنزيل مثبت DLL أو MSI من قسم التنزيلات أو تثبيت API في تطبيق .NET عبر NuGet.

PM> Install-Package GroupDocs.Parser

استخراج النص من ملف Markdown في C#

فيما يلي خطوات استخراج محتوى النص بالكامل من ملف العلامات باستخدام C#.

  • قم بتحميل ملف MD باستخدام فئة Parser.
  • استخراج النص بأكمله إلى TextReader باستخدام أسلوب GetText.
  • استخدم النص كما يحلو لك.

يستخرج الكود المصدري C# التالي المحتوى النصي لملف MD.

// استخراج نص كامل من ملف Markdown
using (Parser parser = new Parser("/path/document.md"))
{
    using (TextReader reader = parser.GetText())
    {
        Console.WriteLine(reader.ReadToEnd());
    }
}

احصل على ترخيص API مجاني

يمكنك الحصول على ترخيص مؤقت مجاني لاستخدام واجهة برمجة التطبيقات بدون قيود التقييم.

استنتاج

للتلخيص ، ناقشنا كيفية استخراج النص من ملفات markdown في C# بمثال. قد يكون هذا قد أرشدك إلى تطوير تطبيق استخراج النص أو محلل المستندات الخاص بك مثل محلل المستندات عبر الإنترنت الذي طوره GroupDocs.

يمكنك معرفة المزيد حول تحليل المستند لـ .NET API باستخدام التوثيق الخاص به. أفضل طريقة للتعلم هي تجربة الأمثلة المتوفرة على GitHub. اتصل بنا لأي استفسار عبر المنتدى.

أنظر أيضا