Die Unterstützung von Markdown-Dateien durch Textverarbeitungseditoren hat ihre Verwendung in großem Umfang erhöht. Daher wird häufig die Konvertierung bestehender Textinhalte in das Markdown-Format gefordert. In diesem Artikel wird erläutert, wie Sie Word-Dokumente programmgesteuert in Markdown-Dateien in Java konvertieren. In letzter Zeit haben wir bereits einige der folgenden verwandten Themen besprochen:
- Konvertieren Sie Word mit C# in Markdown
- Extrahieren Sie Text aus Markdown-Dateien in Java
- Konvertieren Sie Markdown-Dateien in PDF Java
Java-API zum Analysieren und Konvertieren von Markdown-Dateien
GroupDocs bietet APIs, die das Parsen von Word-Dokumenten und deren Konvertierung in andere Formate innerhalb von Anwendungen ermöglichen. Wir werden dessen Java API verwenden, um Word DOC/DOCX-Dateien zu parsen und in MD-Dateien umzuwandeln. Darüber hinaus unterstützt die API das Parsen vieler anderer Dateiformate wie PDFs, Tabellenkalkulationen, Präsentationen, eBooks, Markup-Dokumente, E-Mail-Nachrichten, Bilder und viele andere, die in der Dokumentation erwähnt werden.
Sie können die JAR-Datei aus dem Download-Bereich herunterladen oder die neuesten Repository- und Abhängigkeitskonfigurationen in Ihren Maven-basierten Java-Anwendungen verwenden.
<repository>
<id>groupdocs-artifacts-repository</id>
<name>GroupDocs Artifacts Repository</name>
<url>https://releases.groupdocs.com/java/repo/</url>
</repository>
<dependency>
<groupId>com.groupdocs</groupId>
<artifactId>groupdocs-parser</artifactId>
<version>22.6</version>
</dependency>
So konvertieren Sie Word in Markdown in Java
Warum gehen Sie nicht einfach direkt zum Thema Ihres Interesses und lassen uns das Microsoft Word-Dokument in das Markdown-Format umwandeln? Die folgenden Schritte zeigen, wie Sie Word DOC/DOCX in Markdown in Java konvertieren.
- Laden Sie die MS Word-Datei mit der Klasse Parser.
- Rufen Sie den formatierten Text der geladenen Datei mit der Klasse FormattedTextOptions und dem Markdown-Modus ab.
- Lesen Sie den vollständigen Inhalt mit der readToEnd-Methode.
- Konvertieren Sie es in das Markdown-Format, indem Sie den Inhalt mit der Methode write der Klasse FileWriter in eine MD-Datei schreiben.
Der folgende Java-Quellcode konvertiert das MS Word in eine Markdown-Datei.
import java.io.FileWriter;
import java.io.IOException;
import com.groupdocs.parser.Parser;
import com.groupdocs.parser.data.*;
import com.groupdocs.parser.options.*;
...
...
try (Parser parser = new Parser("/path/document.docx")) {
try (TextReader reader = parser.getFormattedText(new FormattedTextOptions(FormattedTextMode.Markdown))) {
String content = reader.readToEnd();
try {
FileWriter myWriter = new FileWriter("/path/word-to-markdown.md");
myWriter.write(content);
myWriter.close();
}
catch (IOException e) {
e.printStackTrace();
}
}
}
Holen Sie sich eine kostenlose API-Lizenz
Sie können eine kostenlose temporäre Lizenz zur Nutzung der API ohne die Evaluierungseinschränkungen erhalten.
Fazit
Zusammenfassend haben wir gelernt, Word-Dateien in Java innerhalb der Anwendungen in das Markdown-Format zu konvertieren. Sie können diese Funktion in Ihrer Anwendung verwenden. Sie können Ihre Anwendung erweitern, indem Sie andere verfügbare Funktionen der API verwenden.
Erfahren Sie mehr über die Java-Parser-API, indem Sie ihre Dokumentation und die auf GitHub verfügbaren Beispiele ausprobieren. Kontaktieren Sie uns bei Fragen über das Forum.