Konvertieren Sie Word-Dokumente in Markdown in Java

Die Unterstützung von Markdown-Dateien durch Textverarbeitungseditoren hat ihre Verwendung in großem Umfang erhöht. Daher wird häufig die Konvertierung bestehender Textinhalte in das Markdown-Format gefordert. In diesem Artikel wird erläutert, wie Sie Word-Dokumente programmgesteuert in Markdown-Dateien in Java konvertieren. In letzter Zeit haben wir bereits einige der folgenden verwandten Themen besprochen:

Java-API zum Analysieren und Konvertieren von Markdown-Dateien

GroupDocs bietet APIs, die das Parsen von Word-Dokumenten und deren Konvertierung in andere Formate innerhalb von Anwendungen ermöglichen. Wir werden dessen Java API verwenden, um Word DOC/DOCX-Dateien zu parsen und in MD-Dateien umzuwandeln. Darüber hinaus unterstützt die API das Parsen vieler anderer Dateiformate wie PDFs, Tabellenkalkulationen, Präsentationen, eBooks, Markup-Dokumente, E-Mail-Nachrichten, Bilder und viele andere, die in der Dokumentation erwähnt werden.

Sie können die JAR-Datei aus dem Download-Bereich herunterladen oder die neuesten Repository- und Abhängigkeitskonfigurationen in Ihren Maven-basierten Java-Anwendungen verwenden.

<repository>
    <id>groupdocs-artifacts-repository</id>
    <name>GroupDocs Artifacts Repository</name>
    <url>https://releases.groupdocs.com/java/repo/</url>
</repository>
<dependency>
    <groupId>com.groupdocs</groupId>
    <artifactId>groupdocs-parser</artifactId>
    <version>22.6</version>
</dependency>

So konvertieren Sie Word in Markdown in Java

Warum gehen Sie nicht einfach direkt zum Thema Ihres Interesses und lassen uns das Microsoft Word-Dokument in das Markdown-Format umwandeln? Die folgenden Schritte zeigen, wie Sie Word DOC/DOCX in Markdown in Java konvertieren.

  • Laden Sie die MS Word-Datei mit der Klasse Parser.
  • Rufen Sie den formatierten Text der geladenen Datei mit der Klasse FormattedTextOptions und dem Markdown-Modus ab.
  • Lesen Sie den vollständigen Inhalt mit der readToEnd-Methode.
  • Konvertieren Sie es in das Markdown-Format, indem Sie den Inhalt mit der Methode write der Klasse FileWriter in eine MD-Datei schreiben.

Der folgende Java-Quellcode konvertiert das MS Word in eine Markdown-Datei.

import java.io.FileWriter;
import java.io.IOException;
import com.groupdocs.parser.Parser;
import com.groupdocs.parser.data.*;
import com.groupdocs.parser.options.*;
...
...
try (Parser parser = new Parser("/path/document.docx")) {
    try (TextReader reader = parser.getFormattedText(new FormattedTextOptions(FormattedTextMode.Markdown))) {
        String content = reader.readToEnd();
        try {
            FileWriter myWriter = new FileWriter("/path/word-to-markdown.md");
            myWriter.write(content);
            myWriter.close();
        }
        catch (IOException e) {
            e.printStackTrace();
        }
    }
}

Holen Sie sich eine kostenlose API-Lizenz

Sie können eine kostenlose temporäre Lizenz zur Nutzung der API ohne die Evaluierungseinschränkungen erhalten.

Fazit

Zusammenfassend haben wir gelernt, Word-Dateien in Java innerhalb der Anwendungen in das Markdown-Format zu konvertieren. Sie können diese Funktion in Ihrer Anwendung verwenden. Sie können Ihre Anwendung erweitern, indem Sie andere verfügbare Funktionen der API verwenden.

Erfahren Sie mehr über die Java-Parser-API, indem Sie ihre Dokumentation und die auf GitHub verfügbaren Beispiele ausprobieren. Kontaktieren Sie uns bei Fragen über das Forum.

Siehe auch