แปลงเอกสาร Word เป็น Markdown ใน Java

การรองรับไฟล์มาร์กดาวน์โดยโปรแกรมแก้ไขการประมวลผลคำได้เพิ่มการใช้งานในระดับมาก ดังนั้นจึงมักต้องการการแปลงเนื้อหาข้อความที่มีอยู่เป็นรูปแบบมาร์กดาวน์ บทความนี้กล่าวถึงวิธีการแปลงเอกสาร Word เป็นไฟล์มาร์กดาวน์ใน Java โดยทางโปรแกรม เมื่อเร็ว ๆ นี้ เราได้พูดถึงบางหัวข้อที่เกี่ยวข้องต่อไปนี้แล้ว:

Java API เพื่อแยกวิเคราะห์และแปลงไฟล์ Markdown

GroupDocs มี API ที่อนุญาตให้แยกวิเคราะห์เอกสาร Word และแปลงเป็นรูปแบบอื่นภายในแอปพลิเคชัน เราจะใช้ Java API เพื่อแยกวิเคราะห์และแปลงไฟล์ Word DOC/DOCX เป็นไฟล์ MD นอกจากนี้ API ยังรองรับการแยกวิเคราะห์รูปแบบไฟล์อื่นๆ มากมาย เช่น PDF, สเปรดชีต, งานนำเสนอ, eBook, เอกสารมาร์กอัป, ข้อความอีเมล, รูปภาพ และอื่นๆ อีกมากมายที่กล่าวถึงในเอกสารประกอบ

คุณสามารถดาวน์โหลดไฟล์ JAR ได้จาก ส่วนการดาวน์โหลด หรือใช้พื้นที่เก็บข้อมูลล่าสุดและการกำหนดค่าการพึ่งพาภายในแอปพลิเคชัน Java ที่ใช้ Maven

<repository>
    <id>groupdocs-artifacts-repository</id>
    <name>GroupDocs Artifacts Repository</name>
    <url>https://releases.groupdocs.com/java/repo/</url>
</repository>
<dependency>
    <groupId>com.groupdocs</groupId>
    <artifactId>groupdocs-parser</artifactId>
    <version>22.6</version>
</dependency>

วิธีแปลง Word เป็น Markdown ใน Java

ทำไมไม่ลองตรงไปที่หัวข้อที่คุณสนใจแล้วแปลงเอกสาร Microsoft Word ให้เป็นรูปแบบมาร์กดาวน์ดูล่ะ ขั้นตอนต่อไปนี้แสดงวิธีการแปลง Word DOC/DOCX เป็น Markdown ใน Java

  • โหลดไฟล์ MS Word โดยใช้คลาส Parser
  • รับข้อความที่จัดรูปแบบของไฟล์ที่โหลดโดยใช้คลาส FormattedTextOptions และโหมด Markdown
  • อ่านเนื้อหาทั้งหมดโดยใช้เมธอด readToEnd
  • แปลงเป็นรูปแบบมาร์กดาวน์โดยเขียนเนื้อหาลงในไฟล์ MD โดยใช้วิธีเขียนของคลาส FileWriter

ซอร์สโค้ด Java ต่อไปนี้แปลง MS Word เป็นไฟล์ Markdown

import java.io.FileWriter;
import java.io.IOException;
import com.groupdocs.parser.Parser;
import com.groupdocs.parser.data.*;
import com.groupdocs.parser.options.*;
...
...
try (Parser parser = new Parser("/path/document.docx")) {
    try (TextReader reader = parser.getFormattedText(new FormattedTextOptions(FormattedTextMode.Markdown))) {
        String content = reader.readToEnd();
        try {
            FileWriter myWriter = new FileWriter("/path/word-to-markdown.md");
            myWriter.write(content);
            myWriter.close();
        }
        catch (IOException e) {
            e.printStackTrace();
        }
    }
}

รับใบอนุญาต API ฟรี

คุณสามารถรับ ใบอนุญาตชั่วคราวฟรีเพื่อใช้ API โดยไม่มีข้อจำกัดในการประเมิน

บทสรุป

โดยสรุป เราเรียนรู้การแปลงไฟล์ Word เป็นรูปแบบมาร์กดาวน์ใน Java ภายในแอปพลิเคชัน คุณสามารถใช้คุณสมบัตินี้ภายในแอปพลิเคชันของคุณ คุณสามารถขยายแอปพลิเคชันของคุณได้โดยใช้คุณสมบัติอื่นๆ ที่มีของ API

เรียนรู้เพิ่มเติมเกี่ยวกับ Java Parser API โดยใช้ เอกสารประกอบ และสัมผัสกับตัวอย่างที่มีอยู่ใน GitHub ติดต่อเราสำหรับคำถามใด ๆ ผ่านทาง ฟอรัม

ดูสิ่งนี้ด้วย