Konversi Dokumen Word ke Markdown di Java

Dukungan file penurunan harga oleh editor pengolah kata telah meningkatkan penggunaannya dalam skala besar. Karenanya konversi konten teks yang ada ke dalam format penurunan harga sering diminta. Artikel ini membahas cara mengonversi dokumen Word secara terprogram menjadi file markdown di Java. Baru-baru ini, kami telah membahas beberapa topik terkait berikut:

Java API untuk Mengurai dan Mengonversi File Markdown

GroupDocs menyediakan API yang memungkinkan penguraian dokumen Word dan konversinya ke format lain dalam aplikasi. Kami akan menggunakan Java API untuk mengurai dan mengubah file Word DOC/DOCX menjadi file MD. Selanjutnya, API mendukung penguraian banyak format file lain seperti PDF, spreadsheet, presentasi, eBuku, dokumen markup, pesan email, gambar, dan banyak lainnya yang disebutkan dalam dokumentasi.

Anda dapat mengunduh file JAR dari bagian unduhan atau menggunakan repositori terbaru dan konfigurasi ketergantungan dalam aplikasi Java berbasis Maven Anda.

<repository>
    <id>groupdocs-artifacts-repository</id>
    <name>GroupDocs Artifacts Repository</name>
    <url>https://releases.groupdocs.com/java/repo/</url>
</repository>
<dependency>
    <groupId>com.groupdocs</groupId>
    <artifactId>groupdocs-parser</artifactId>
    <version>22.6</version>
</dependency>

Cara Mengonversi Word ke Markdown di Java

Mengapa tidak langsung saja ke topik yang Anda minati dan mari ubah dokumen Microsoft Word menjadi format penurunan harga? Langkah-langkah berikut menunjukkan cara mengonversi Word DOC/DOCX ke Markdown di Java.

  • Muat file MS Word menggunakan kelas Parser.
  • Dapatkan teks terformat dari file yang dimuat menggunakan kelas FormattedTextOptions dan mode Markdown.
  • Baca konten lengkap menggunakan metode readToEnd.
  • Konversikan ke format markdown dengan menulis konten ke file MD menggunakan metode tulis kelas FileWriter.

Kode sumber Java berikut mengubah MS Word menjadi file Markdown.

import java.io.FileWriter;
import java.io.IOException;
import com.groupdocs.parser.Parser;
import com.groupdocs.parser.data.*;
import com.groupdocs.parser.options.*;
...
...
try (Parser parser = new Parser("/path/document.docx")) {
    try (TextReader reader = parser.getFormattedText(new FormattedTextOptions(FormattedTextMode.Markdown))) {
        String content = reader.readToEnd();
        try {
            FileWriter myWriter = new FileWriter("/path/word-to-markdown.md");
            myWriter.write(content);
            myWriter.close();
        }
        catch (IOException e) {
            e.printStackTrace();
        }
    }
}

Dapatkan Lisensi API Gratis

Anda bisa mendapatkan lisensi sementara gratis untuk menggunakan API tanpa batasan evaluasi.

Kesimpulan

Singkatnya, kami belajar mengonversi file Word menjadi format penurunan harga di Java di dalam aplikasi. Anda dapat memanfaatkan fitur ini dalam aplikasi Anda. Anda dapat memperluas aplikasi Anda dengan menggunakan fitur lain yang tersedia dari API.

Pelajari lebih lanjut tentang Java Parser API menggunakan dokumentasi dan dengan melihat contoh yang tersedia di GitHub. Hubungi kami untuk pertanyaan apa pun melalui forum.

Lihat juga