تبدیل سند Word به Markdown در جاوا

پشتیبانی از فایل های علامت گذاری توسط ویرایشگرهای واژه پرداز، استفاده از آن را در مقیاس بزرگ افزایش داده است. از این رو تبدیل محتوای متن موجود به فرمت نشانه گذاری اغلب مورد نیاز است. این مقاله نحوه تبدیل اسناد Word را به صورت برنامه‌نویسی به فایل‌های علامت‌گذاری در Java مورد بحث قرار می‌دهد. اخیراً در مورد برخی از موضوعات مرتبط زیر بحث کرده ایم:

Java API برای تجزیه و تبدیل فایل های Markdown

GroupDocs API هایی را ارائه می دهد که امکان تجزیه اسناد Word و تبدیل آن به فرمت های دیگر را در برنامه ها فراهم می کند. ما از Java API آن برای تجزیه و تبدیل فایل‌های Word DOC/DOCX به فایل‌های MD استفاده می‌کنیم. علاوه بر این، API از تجزیه بسیاری از فرمت‌های فایل دیگر مانند PDF، صفحات گسترده، ارائه‌ها، کتاب‌های الکترونیکی، اسناد نشانه‌گذاری، پیام‌های ایمیل، تصاویر و بسیاری دیگر از موارد ذکر شده در اسناد پشتیبانی می‌کند.

می‌توانید فایل JAR را از بخش دانلودها دانلود کنید یا از آخرین پیکربندی‌های مخزن و وابستگی در برنامه‌های Java مبتنی بر Maven خود استفاده کنید.

<repository>
    <id>groupdocs-artifacts-repository</id>
    <name>GroupDocs Artifacts Repository</name>
    <url>https://releases.groupdocs.com/java/repo/</url>
</repository>
<dependency>
    <groupId>com.groupdocs</groupId>
    <artifactId>groupdocs-parser</artifactId>
    <version>22.6</version>
</dependency>

نحوه تبدیل Word به Markdown در جاوا

چرا مستقیماً به موضوع مورد علاقه خود نروید و اجازه دهید سند مایکروسافت ورد را به فرمت علامت گذاری تبدیل کنیم؟ مراحل زیر نحوه تبدیل Word DOC/DOCX به Markdown در Java را نشان می دهد.

  • فایل MS Word را با استفاده از کلاس Parser بارگیری کنید.
  • متن فرمت شده فایل بارگذاری شده را با استفاده از کلاس FormattedTextOptions و حالت Markdown دریافت کنید.
  • محتوای کامل را با استفاده از روش readToEnd بخوانید.
  • با نوشتن محتوا به یک فایل MD با استفاده از روش نوشتن کلاس FileWriter آن را به فرمت نشانه گذاری تبدیل کنید.

کد منبع Java زیر MS Word را به یک فایل Markdown تبدیل می کند.

import java.io.FileWriter;
import java.io.IOException;
import com.groupdocs.parser.Parser;
import com.groupdocs.parser.data.*;
import com.groupdocs.parser.options.*;
...
...
try (Parser parser = new Parser("/path/document.docx")) {
    try (TextReader reader = parser.getFormattedText(new FormattedTextOptions(FormattedTextMode.Markdown))) {
        String content = reader.readToEnd();
        try {
            FileWriter myWriter = new FileWriter("/path/word-to-markdown.md");
            myWriter.write(content);
            myWriter.close();
        }
        catch (IOException e) {
            e.printStackTrace();
        }
    }
}

مجوز API رایگان دریافت کنید

می توانید بدون محدودیت ارزیابی، مجوز موقت رایگان برای استفاده از API دریافت کنید.

نتیجه

به طور خلاصه، ما یاد گرفتیم که فایل های Word را در برنامه های کاربردی به فرمت علامت گذاری در Java تبدیل کنیم. می توانید از این ویژگی در برنامه خود استفاده کنید. با استفاده از سایر ویژگی های موجود API می توانید برنامه خود را گسترش دهید.

با استفاده از مستندات و با تجربه نمونه‌های موجود در GitHub درباره Java Parser API بیشتر بیاموزید. برای هرگونه سوال از طریق فروم با ما تماس بگیرید.

همچنین ببینید