Підтримка файлів розмітки редакторами текстових процесорів збільшила їх використання у великих масштабах. Тому часто потрібно конвертувати існуючий текстовий вміст у формат розцінки. У цій статті обговорюється, як програмно перетворити документи Word у файли розмітки в Java. Нещодавно ми вже обговорювали деякі з наступних пов’язаних тем:
- Перетворення Word на Markdown за допомогою C#
- Витягніть текст із файлів Markdown у Java
- Перетворення файлів Markdown на PDF Java
Java API для аналізу та перетворення файлів Markdown
GroupDocs надає API, які дозволяють аналізувати документ Word і перетворювати його в інші формати в програмах. Ми будемо використовувати його API Java для аналізу та перетворення файлів Word DOC/DOCX у файли MD. Крім того, API підтримує аналіз багатьох інших форматів файлів, таких як PDF-файли, електронні таблиці, презентації, електронні книги, документи з розміткою, повідомлення електронної пошти, зображення та багато інших, згаданих у документації.
Ви можете завантажити файл JAR із розділу завантажень або скористатися найновішим репозиторієм і конфігураціями залежностей у своїх програмах Java на основі Maven.
<repository>
<id>groupdocs-artifacts-repository</id>
<name>GroupDocs Artifacts Repository</name>
<url>https://releases.groupdocs.com/java/repo/</url>
</repository>
<dependency>
<groupId>com.groupdocs</groupId>
<artifactId>groupdocs-parser</artifactId>
<version>22.6</version>
</dependency>
Як конвертувати Word у Markdown у Java
Чому б просто не перейти безпосередньо до теми, яка вас цікавить, і давайте перетворити документ Microsoft Word у формат уцінки? Наступні кроки показують, як конвертувати Word DOC/DOCX у Markdown у Java.
- Завантажте файл MS Word за допомогою класу Parser.
- Отримайте відформатований текст завантаженого файлу за допомогою класу FormattedTextOptions і режиму Markdown.
- Прочитайте весь вміст за допомогою методу readToEnd.
- Перетворіть його у формат розцінки, записавши вміст у файл MD за допомогою методу запису класу FileWriter.
Наступний вихідний код Java перетворює MS Word на файл Markdown.
import java.io.FileWriter;
import java.io.IOException;
import com.groupdocs.parser.Parser;
import com.groupdocs.parser.data.*;
import com.groupdocs.parser.options.*;
...
...
try (Parser parser = new Parser("/path/document.docx")) {
try (TextReader reader = parser.getFormattedText(new FormattedTextOptions(FormattedTextMode.Markdown))) {
String content = reader.readToEnd();
try {
FileWriter myWriter = new FileWriter("/path/word-to-markdown.md");
myWriter.write(content);
myWriter.close();
}
catch (IOException e) {
e.printStackTrace();
}
}
}
Отримайте безкоштовну ліцензію API
Ви можете отримати безкоштовну тимчасову ліцензію на використання API без оціночних обмежень.
Висновок
Підводячи підсумок, ми навчилися конвертувати файли Word у формат уцінки на Java в додатках. Ви можете використовувати цю функцію у своїй програмі. Ви можете розширити свою програму за допомогою інших доступних функцій API.
Дізнайтеся більше про Java Parser API, використовуючи його документацію і переглянувши приклади, доступні на GitHub. Зв’яжіться з нами для будь-якого запиту через форум.