Konwertuj dokument Word na Markdown w Javie

Obsługa plików przecen przez edytory tekstu zwiększyła ich wykorzystanie na dużą skalę. Dlatego często wymagana jest konwersja istniejącej treści tekstowej do formatu markdown. W tym artykule omówiono, jak programowo konwertować dokumenty programu Word na pliki przeceny w języku Java. Ostatnio omówiliśmy już niektóre z następujących powiązanych tematów:

Java API do analizowania i konwertowania plików Markdown

GroupDocs udostępnia interfejsy API, które umożliwiają analizowanie dokumentów programu Word i ich konwersję do innych formatów w aplikacjach. Użyjemy jego Java API do analizowania i przekształcania plików Word DOC/DOCX w pliki MD. Ponadto interfejs API obsługuje analizowanie wielu innych formatów plików, takich jak pliki PDF, arkusze kalkulacyjne, prezentacje, książki elektroniczne, dokumenty znaczników, wiadomości e-mail, obrazy i wiele innych wymienionych w dokumentacji.

Możesz pobrać plik JAR z sekcji pobierania lub skorzystać z najnowszych konfiguracji repozytorium i zależności w swoich aplikacjach Java opartych na Maven.

<repository>
    <id>groupdocs-artifacts-repository</id>
    <name>GroupDocs Artifacts Repository</name>
    <url>https://releases.groupdocs.com/java/repo/</url>
</repository>
<dependency>
    <groupId>com.groupdocs</groupId>
    <artifactId>groupdocs-parser</artifactId>
    <version>22.6</version>
</dependency>

Jak przekonwertować Worda na Markdown w Javie

Dlaczego nie przejść od razu do interesującego Cię tematu i nie przekonwertować dokumentu Microsoft Word do formatu markdown? Poniższe kroki pokazują, jak przekonwertować Word DOC/DOCX na Markdown w Javie.

  • Załaduj plik MS Word, używając klasy Parser.
  • Pobierz sformatowany tekst załadowanego pliku przy użyciu klasy FormattedTextOptions i trybu Markdown.
  • Przeczytaj całą treść za pomocą metody readToEnd.
  • Przekonwertuj go do formatu markdown, zapisując zawartość do pliku MD przy użyciu metody zapisu klasy FileWriter.

Poniższy kod źródłowy Java konwertuje MS Word na plik Markdown.

import java.io.FileWriter;
import java.io.IOException;
import com.groupdocs.parser.Parser;
import com.groupdocs.parser.data.*;
import com.groupdocs.parser.options.*;
...
...
try (Parser parser = new Parser("/path/document.docx")) {
    try (TextReader reader = parser.getFormattedText(new FormattedTextOptions(FormattedTextMode.Markdown))) {
        String content = reader.readToEnd();
        try {
            FileWriter myWriter = new FileWriter("/path/word-to-markdown.md");
            myWriter.write(content);
            myWriter.close();
        }
        catch (IOException e) {
            e.printStackTrace();
        }
    }
}

Uzyskaj bezpłatną licencję API

Możesz otrzymać bezpłatną tymczasową licencję na korzystanie z API bez ograniczeń ewaluacyjnych.

Wniosek

Podsumowując, nauczyliśmy się konwertować pliki Worda do formatu markdown w Javie w ramach aplikacji. Możesz wykorzystać tę funkcję w swojej aplikacji. Możesz rozszerzyć swoją aplikację, korzystając z innych dostępnych funkcji API.

Dowiedz się więcej o interfejsie Java Parser API, korzystając z jego dokumentacji i zapoznając się z przykładami dostępnymi na GitHub. Skontaktuj się z nami w przypadku jakichkolwiek pytań za pośrednictwem forum.

Zobacz też