Obsługa plików przecen przez edytory tekstu zwiększyła ich wykorzystanie na dużą skalę. Dlatego często wymagana jest konwersja istniejącej treści tekstowej do formatu markdown. W tym artykule omówiono, jak programowo konwertować dokumenty programu Word na pliki przeceny w języku Java. Ostatnio omówiliśmy już niektóre z następujących powiązanych tematów:
- Konwertuj Word na Markdown za pomocą C#
- Wyodrębnij tekst z plików Markdown w Javie
- Konwertuj pliki Markdown na PDF Java
Java API do analizowania i konwertowania plików Markdown
GroupDocs udostępnia interfejsy API, które umożliwiają analizowanie dokumentów programu Word i ich konwersję do innych formatów w aplikacjach. Użyjemy jego Java API do analizowania i przekształcania plików Word DOC/DOCX w pliki MD. Ponadto interfejs API obsługuje analizowanie wielu innych formatów plików, takich jak pliki PDF, arkusze kalkulacyjne, prezentacje, książki elektroniczne, dokumenty znaczników, wiadomości e-mail, obrazy i wiele innych wymienionych w dokumentacji.
Możesz pobrać plik JAR z sekcji pobierania lub skorzystać z najnowszych konfiguracji repozytorium i zależności w swoich aplikacjach Java opartych na Maven.
<repository>
<id>groupdocs-artifacts-repository</id>
<name>GroupDocs Artifacts Repository</name>
<url>https://releases.groupdocs.com/java/repo/</url>
</repository>
<dependency>
<groupId>com.groupdocs</groupId>
<artifactId>groupdocs-parser</artifactId>
<version>22.6</version>
</dependency>
Jak przekonwertować Worda na Markdown w Javie
Dlaczego nie przejść od razu do interesującego Cię tematu i nie przekonwertować dokumentu Microsoft Word do formatu markdown? Poniższe kroki pokazują, jak przekonwertować Word DOC/DOCX na Markdown w Javie.
- Załaduj plik MS Word, używając klasy Parser.
- Pobierz sformatowany tekst załadowanego pliku przy użyciu klasy FormattedTextOptions i trybu Markdown.
- Przeczytaj całą treść za pomocą metody readToEnd.
- Przekonwertuj go do formatu markdown, zapisując zawartość do pliku MD przy użyciu metody zapisu klasy FileWriter.
Poniższy kod źródłowy Java konwertuje MS Word na plik Markdown.
import java.io.FileWriter;
import java.io.IOException;
import com.groupdocs.parser.Parser;
import com.groupdocs.parser.data.*;
import com.groupdocs.parser.options.*;
...
...
try (Parser parser = new Parser("/path/document.docx")) {
try (TextReader reader = parser.getFormattedText(new FormattedTextOptions(FormattedTextMode.Markdown))) {
String content = reader.readToEnd();
try {
FileWriter myWriter = new FileWriter("/path/word-to-markdown.md");
myWriter.write(content);
myWriter.close();
}
catch (IOException e) {
e.printStackTrace();
}
}
}
Uzyskaj bezpłatną licencję API
Możesz otrzymać bezpłatną tymczasową licencję na korzystanie z API bez ograniczeń ewaluacyjnych.
Wniosek
Podsumowując, nauczyliśmy się konwertować pliki Worda do formatu markdown w Javie w ramach aplikacji. Możesz wykorzystać tę funkcję w swojej aplikacji. Możesz rozszerzyć swoją aplikację, korzystając z innych dostępnych funkcji API.
Dowiedz się więcej o interfejsie Java Parser API, korzystając z jego dokumentacji i zapoznając się z przykładami dostępnymi na GitHub. Skontaktuj się z nami w przypadku jakichkolwiek pytań za pośrednictwem forum.