Converti documento Word in Markdown in Java

Il supporto dei file markdown da parte degli editor di elaborazione testi ne ha aumentato l’utilizzo su larga scala. Quindi è spesso richiesta la conversione del contenuto di testo esistente in formato markdown. Questo articolo illustra come convertire a livello di codice i documenti di Word in file markdown in Java. Di recente, abbiamo già discusso alcuni dei seguenti argomenti correlati:

API Java per analizzare e convertire file Markdown

GroupDocs fornisce API che consentono l’analisi dei documenti di Word e la loro conversione in altri formati all’interno delle applicazioni. Useremo la sua Java API per analizzare e trasformare i file Word DOC/DOCX in file MD. Inoltre, l’API supporta l’analisi di molti altri formati di file come PDF, fogli di calcolo, presentazioni, eBook, documenti di markup, messaggi di posta elettronica, immagini e molti altri menzionati nella documentazione.

Puoi scaricare il file JAR dalla sezione download o utilizzare l’ultimo repository e le configurazioni delle dipendenze all’interno delle tue applicazioni Java basate su Maven.

<repository>
    <id>groupdocs-artifacts-repository</id>
    <name>GroupDocs Artifacts Repository</name>
    <url>https://releases.groupdocs.com/java/repo/</url>
</repository>
<dependency>
    <groupId>com.groupdocs</groupId>
    <artifactId>groupdocs-parser</artifactId>
    <version>22.6</version>
</dependency>

Come convertire Word in Markdown in Java

Perché non passare direttamente all’argomento di tuo interesse e trasformare il documento Microsoft Word in formato markdown? I passaggi seguenti mostrano come convertire Word DOC/DOCX in Markdown in Java.

  • Carica il file MS Word usando la classe Parser.
  • Ottieni il testo formattato del file caricato usando la classe FormattedTextOptions e la modalità Markdown.
  • Leggi il contenuto completo usando il metodo readToEnd.
  • Convertilo in formato markdown scrivendo il contenuto in un file MD usando il metodo di scrittura della classe FileWriter.

Il seguente codice sorgente Java converte MS Word in un file Markdown.

import java.io.FileWriter;
import java.io.IOException;
import com.groupdocs.parser.Parser;
import com.groupdocs.parser.data.*;
import com.groupdocs.parser.options.*;
...
...
try (Parser parser = new Parser("/path/document.docx")) {
    try (TextReader reader = parser.getFormattedText(new FormattedTextOptions(FormattedTextMode.Markdown))) {
        String content = reader.readToEnd();
        try {
            FileWriter myWriter = new FileWriter("/path/word-to-markdown.md");
            myWriter.write(content);
            myWriter.close();
        }
        catch (IOException e) {
            e.printStackTrace();
        }
    }
}

Ottieni una licenza API gratuita

Puoi ottenere una licenza temporanea gratuita per utilizzare l’API senza limitazioni di valutazione.

Conclusione

Per riassumere, abbiamo imparato a convertire i file di Word in formato markdown in Java all’interno delle applicazioni. Puoi utilizzare questa funzione all’interno della tua applicazione. Puoi estendere la tua applicazione utilizzando altre funzionalità disponibili dell’API.

Scopri di più sull’API Java Parser utilizzando la sua documentazione e sperimentando gli esempi disponibili su GitHub. Contattaci per qualsiasi domanda tramite il forum.

Guarda anche