Převeďte dokument Word na Markdown v Java

Podpora markdown souborů ze strany editorů pro zpracování textu zvýšila jeho použití ve velkém měřítku. Proto je často požadován převod stávajícího textového obsahu do formátu markdown. Tento článek popisuje, jak programově převést dokumenty aplikace Word na soubory markdown v jazyce Java. Nedávno jsme již probírali některá z následujících souvisejících témat:

Java API pro analýzu a převod souborů Markdown

GroupDocs poskytuje rozhraní API, která umožňují analýzu dokumentů aplikace Word a jejich převod do jiných formátů v rámci aplikací. Jeho Java API použijeme k analýze a transformaci souborů Word DOC/DOCX na soubory MD. Kromě toho API podporuje analýzu mnoha dalších formátů souborů, jako jsou PDF, tabulky, prezentace, elektronické knihy, značkovací dokumenty, e-mailové zprávy, obrázky a mnoho dalších zmíněných v dokumentaci.

Soubor JAR si můžete stáhnout z části ke stažení nebo použít nejnovější konfigurace úložiště a závislostí v rámci vašich Java aplikací založených na Maven.

<repository>
    <id>groupdocs-artifacts-repository</id>
    <name>GroupDocs Artifacts Repository</name>
    <url>https://releases.groupdocs.com/java/repo/</url>
</repository>
<dependency>
    <groupId>com.groupdocs</groupId>
    <artifactId>groupdocs-parser</artifactId>
    <version>22.6</version>
</dependency>

Jak převést Word na Markdown v Java

Proč se rovnou neposunout k tématu, které vás zajímá, a nepřevést dokument Microsoft Word do formátu markdown? Následující kroky ukazují, jak převést Word DOC/DOCX na Markdown v Java.

  • Načtěte soubor MS Word pomocí třídy Parser.
  • Získejte formátovaný text načteného souboru pomocí třídy FormattedTextOptions a režimu Markdown.
  • Přečtěte si celý obsah pomocí metody readToEnd.
  • Převeďte jej do formátu markdown zápisem obsahu do souboru MD pomocí metody zápisu třídy FileWriter.

Následující zdrojový kód Java převádí MS Word na soubor Markdown.

import java.io.FileWriter;
import java.io.IOException;
import com.groupdocs.parser.Parser;
import com.groupdocs.parser.data.*;
import com.groupdocs.parser.options.*;
...
...
try (Parser parser = new Parser("/path/document.docx")) {
    try (TextReader reader = parser.getFormattedText(new FormattedTextOptions(FormattedTextMode.Markdown))) {
        String content = reader.readToEnd();
        try {
            FileWriter myWriter = new FileWriter("/path/word-to-markdown.md");
            myWriter.write(content);
            myWriter.close();
        }
        catch (IOException e) {
            e.printStackTrace();
        }
    }
}

Získejte bezplatnou licenci API

Můžete získat bezplatnou dočasnou licenci k používání API bez omezení hodnocení.

Závěr

Abychom to shrnuli, naučili jsme se v rámci aplikací převádět soubory Wordu do formátu markdown v Java. Tuto funkci můžete využít ve své aplikaci. Aplikaci můžete rozšířit pomocí dalších dostupných funkcí rozhraní API.

Zjistěte více o Java Parser API pomocí jeho dokumentace a vyzkoušejte příklady dostupné na GitHub. Kontaktujte nás s jakýmkoli dotazem prostřednictvím fóra.

Viz také