پشتیبانی از فایل های علامت گذاری توسط ویرایشگرهای واژه پرداز، استفاده از آن را در مقیاس بزرگ افزایش داده است. از این رو تبدیل محتوای متن موجود به فرمت نشانه گذاری اغلب مورد نیاز است. این مقاله نحوه تبدیل اسناد Word را به صورت برنامهنویسی به فایلهای علامتگذاری در Java مورد بحث قرار میدهد. اخیراً در مورد برخی از موضوعات مرتبط زیر بحث کرده ایم:
- تبدیل Word به Markdown با استفاده از سی شارپ
- متن را از فایل های Markdown در Java استخراج کنید
- تبدیل فایل های Markdown به پی دی اف جاوا
Java API برای تجزیه و تبدیل فایل های Markdown
GroupDocs API هایی را ارائه می دهد که امکان تجزیه اسناد Word و تبدیل آن به فرمت های دیگر را در برنامه ها فراهم می کند. ما از Java API آن برای تجزیه و تبدیل فایلهای Word DOC/DOCX به فایلهای MD استفاده میکنیم. علاوه بر این، API از تجزیه بسیاری از فرمتهای فایل دیگر مانند PDF، صفحات گسترده، ارائهها، کتابهای الکترونیکی، اسناد نشانهگذاری، پیامهای ایمیل، تصاویر و بسیاری دیگر از موارد ذکر شده در اسناد پشتیبانی میکند.
میتوانید فایل JAR را از بخش دانلودها دانلود کنید یا از آخرین پیکربندیهای مخزن و وابستگی در برنامههای Java مبتنی بر Maven خود استفاده کنید.
<repository>
<id>groupdocs-artifacts-repository</id>
<name>GroupDocs Artifacts Repository</name>
<url>https://releases.groupdocs.com/java/repo/</url>
</repository>
<dependency>
<groupId>com.groupdocs</groupId>
<artifactId>groupdocs-parser</artifactId>
<version>22.6</version>
</dependency>
نحوه تبدیل Word به Markdown در جاوا
چرا مستقیماً به موضوع مورد علاقه خود نروید و اجازه دهید سند مایکروسافت ورد را به فرمت علامت گذاری تبدیل کنیم؟ مراحل زیر نحوه تبدیل Word DOC/DOCX به Markdown در Java را نشان می دهد.
- فایل MS Word را با استفاده از کلاس Parser بارگیری کنید.
- متن فرمت شده فایل بارگذاری شده را با استفاده از کلاس FormattedTextOptions و حالت Markdown دریافت کنید.
- محتوای کامل را با استفاده از روش readToEnd بخوانید.
- با نوشتن محتوا به یک فایل MD با استفاده از روش نوشتن کلاس FileWriter آن را به فرمت نشانه گذاری تبدیل کنید.
کد منبع Java زیر MS Word را به یک فایل Markdown تبدیل می کند.
import java.io.FileWriter;
import java.io.IOException;
import com.groupdocs.parser.Parser;
import com.groupdocs.parser.data.*;
import com.groupdocs.parser.options.*;
...
...
try (Parser parser = new Parser("/path/document.docx")) {
try (TextReader reader = parser.getFormattedText(new FormattedTextOptions(FormattedTextMode.Markdown))) {
String content = reader.readToEnd();
try {
FileWriter myWriter = new FileWriter("/path/word-to-markdown.md");
myWriter.write(content);
myWriter.close();
}
catch (IOException e) {
e.printStackTrace();
}
}
}
مجوز API رایگان دریافت کنید
می توانید بدون محدودیت ارزیابی، مجوز موقت رایگان برای استفاده از API دریافت کنید.
نتیجه
به طور خلاصه، ما یاد گرفتیم که فایل های Word را در برنامه های کاربردی به فرمت علامت گذاری در Java تبدیل کنیم. می توانید از این ویژگی در برنامه خود استفاده کنید. با استفاده از سایر ویژگی های موجود API می توانید برنامه خود را گسترش دهید.
با استفاده از مستندات و با تجربه نمونههای موجود در GitHub درباره Java Parser API بیشتر بیاموزید. برای هرگونه سوال از طریق فروم با ما تماس بگیرید.