غالبًا ما يكون للمطورين متطلبات لاستخراج نص من مستندات مختلفة. لقد ناقشنا بالفعل استخراج أرشيفات مضغوطة ، وعد الكلمات في المستندات ، واستخراج الصور من الكتب الإلكترونية ، وبعض طرق التحليل الأخرى. اليوم ، في هذه المقالة ، ستتعلم كيفية تحليل واستخراج النص من ملفات Markdown في Java.

استخراج النص من ملفات MD باستخدام C# .jpg

Java API لاستخراج نص Markdown

يوفر GroupDocs Java API لتحليل المستندات واستخراج النص من تنسيقات المستندات المختلفة داخل تطبيقات Java. تدعم واجهة برمجة التطبيقات تحليل العديد من تنسيقات الملفات مثل:

  • مستندات معالجة الكلمات: DOC ، DOCX ، …
  • جداول البيانات: XLS ، و XLSX ، …
  • العروض التقديمية: PPT ، PPTX ،….
  • الكتب الإلكترونية: EPUB ، FB2 ، …
  • صور الرمز الشريطي: JPG ، PNG ، …
  • القائمة الكاملة مذكورة في الوثائق.

ومع ذلك ، في هذه المقالة ، سنستخدم GroupDocs.Parser for Java لاستخراج النص فقط من ملفات MD باستخدام Java.

يمكنك تنزيل ملف JAR من قسم التنزيلات ، أو مجرد الحصول على المستودع وتكوينات التبعية لـ pom.xml لتطبيقات Java المستندة إلى المخضرم.

<repository>
    <id>groupdocs-artifacts-repository</id>
    <name>GroupDocs Artifacts Repository</name>
    <url>https://releases.groupdocs.com/java/repo/</url>
</repository>
<dependency>
    <groupId>com.groupdocs</groupId>
    <artifactId>groupdocs-parser</artifactId>
    <version>22.6</version>
</dependency>

استخراج النص من Markdown File في Java

فيما يلي خطوات استخراج محتوى النص بالكامل من ملف markdown في Java.

  • قم بتحميل ملف MD باستخدام فئة Parser.
  • قم باستخراج النص بالكامل إلى TextReader باستخدام طريقة getText.
  • استخدم النص كما يحلو لك.

يستخرج كود مصدر Java التالي المحتوى النصي لملف MD.

// استخراج نص كامل من ملف Markdown في Java
try (Parser parser = new Parser("/path/document.md")) 
{
  TextReader reader = parser.getText()
	System.out.println(reader.readToEnd());
}

احصل على ترخيص API مجاني

يمكنك الحصول على ترخيص مؤقت مجاني لاستخدام واجهة برمجة التطبيقات بدون قيود التقييم.

استنتاج

للتلخيص ، أوضح المقال الطريقة الأساسية والسريعة لكيفية استخراج النص من ملفات markdown في Java. قد يسمح لك هذا الأسلوب بالتفكير في تطوير تطبيق استخراج النص ومحلل المستندات مثل محلل المستندات عبر الإنترنت الذي طوره GroupDocs.

يمكنك معرفة المزيد حول تحليل المستندات Java API باستخدام التوثيق. الطريقة السريعة للتعلم هي تجربة الأمثلة المتوفرة على GitHub. اتصل بنا لأي استفسار عبر المنتدى.

أنظر أيضا