Перетворіть документ Word у Markdown у Java

Підтримка файлів розмітки редакторами текстових процесорів збільшила їх використання у великих масштабах. Тому часто потрібно конвертувати існуючий текстовий вміст у формат розцінки. У цій статті обговорюється, як програмно перетворити документи Word у файли розмітки в Java. Нещодавно ми вже обговорювали деякі з наступних пов’язаних тем:

Java API для аналізу та перетворення файлів Markdown

GroupDocs надає API, які дозволяють аналізувати документ Word і перетворювати його в інші формати в програмах. Ми будемо використовувати його API Java для аналізу та перетворення файлів Word DOC/DOCX у файли MD. Крім того, API підтримує аналіз багатьох інших форматів файлів, таких як PDF-файли, електронні таблиці, презентації, електронні книги, документи з розміткою, повідомлення електронної пошти, зображення та багато інших, згаданих у документації.

Ви можете завантажити файл JAR із розділу завантажень або скористатися найновішим репозиторієм і конфігураціями залежностей у своїх програмах Java на основі Maven.

<repository>
    <id>groupdocs-artifacts-repository</id>
    <name>GroupDocs Artifacts Repository</name>
    <url>https://releases.groupdocs.com/java/repo/</url>
</repository>
<dependency>
    <groupId>com.groupdocs</groupId>
    <artifactId>groupdocs-parser</artifactId>
    <version>22.6</version>
</dependency>

Як конвертувати Word у Markdown у Java

Чому б просто не перейти безпосередньо до теми, яка вас цікавить, і давайте перетворити документ Microsoft Word у формат уцінки? Наступні кроки показують, як конвертувати Word DOC/DOCX у Markdown у Java.

  • Завантажте файл MS Word за допомогою класу Parser.
  • Отримайте відформатований текст завантаженого файлу за допомогою класу FormattedTextOptions і режиму Markdown.
  • Прочитайте весь вміст за допомогою методу readToEnd.
  • Перетворіть його у формат розцінки, записавши вміст у файл MD за допомогою методу запису класу FileWriter.

Наступний вихідний код Java перетворює MS Word на файл Markdown.

import java.io.FileWriter;
import java.io.IOException;
import com.groupdocs.parser.Parser;
import com.groupdocs.parser.data.*;
import com.groupdocs.parser.options.*;
...
...
try (Parser parser = new Parser("/path/document.docx")) {
    try (TextReader reader = parser.getFormattedText(new FormattedTextOptions(FormattedTextMode.Markdown))) {
        String content = reader.readToEnd();
        try {
            FileWriter myWriter = new FileWriter("/path/word-to-markdown.md");
            myWriter.write(content);
            myWriter.close();
        }
        catch (IOException e) {
            e.printStackTrace();
        }
    }
}

Отримайте безкоштовну ліцензію API

Ви можете отримати безкоштовну тимчасову ліцензію на використання API без оціночних обмежень.

Висновок

Підводячи підсумок, ми навчилися конвертувати файли Word у формат уцінки на Java в додатках. Ви можете використовувати цю функцію у своїй програмі. Ви можете розширити свою програму за допомогою інших доступних функцій API.

Дізнайтеся більше про Java Parser API, використовуючи його документацію і переглянувши приклади, доступні на GitHub. Зв’яжіться з нами для будь-якого запиту через форум.

Дивись також