การรองรับไฟล์มาร์กดาวน์โดยโปรแกรมแก้ไขการประมวลผลคำได้เพิ่มการใช้งานในระดับมาก ดังนั้นจึงมักต้องการการแปลงเนื้อหาข้อความที่มีอยู่เป็นรูปแบบมาร์กดาวน์ บทความนี้กล่าวถึงวิธีการแปลงเอกสาร Word เป็นไฟล์มาร์กดาวน์ใน Java โดยทางโปรแกรม เมื่อเร็ว ๆ นี้ เราได้พูดถึงบางหัวข้อที่เกี่ยวข้องต่อไปนี้แล้ว:
- แปลง Word เป็น Markdown โดยใช้ C#
- แยกข้อความจากไฟล์ Markdown ใน Java
- แปลงไฟล์ Markdown เป็น PDF Java
Java API เพื่อแยกวิเคราะห์และแปลงไฟล์ Markdown
GroupDocs มี API ที่อนุญาตให้แยกวิเคราะห์เอกสาร Word และแปลงเป็นรูปแบบอื่นภายในแอปพลิเคชัน เราจะใช้ Java API เพื่อแยกวิเคราะห์และแปลงไฟล์ Word DOC/DOCX เป็นไฟล์ MD นอกจากนี้ API ยังรองรับการแยกวิเคราะห์รูปแบบไฟล์อื่นๆ มากมาย เช่น PDF, สเปรดชีต, งานนำเสนอ, eBook, เอกสารมาร์กอัป, ข้อความอีเมล, รูปภาพ และอื่นๆ อีกมากมายที่กล่าวถึงในเอกสารประกอบ
คุณสามารถดาวน์โหลดไฟล์ JAR ได้จาก ส่วนการดาวน์โหลด หรือใช้พื้นที่เก็บข้อมูลล่าสุดและการกำหนดค่าการพึ่งพาภายในแอปพลิเคชัน Java ที่ใช้ Maven
<repository>
<id>groupdocs-artifacts-repository</id>
<name>GroupDocs Artifacts Repository</name>
<url>https://releases.groupdocs.com/java/repo/</url>
</repository>
<dependency>
<groupId>com.groupdocs</groupId>
<artifactId>groupdocs-parser</artifactId>
<version>22.6</version>
</dependency>
วิธีแปลง Word เป็น Markdown ใน Java
ทำไมไม่ลองตรงไปที่หัวข้อที่คุณสนใจแล้วแปลงเอกสาร Microsoft Word ให้เป็นรูปแบบมาร์กดาวน์ดูล่ะ ขั้นตอนต่อไปนี้แสดงวิธีการแปลง Word DOC/DOCX เป็น Markdown ใน Java
- โหลดไฟล์ MS Word โดยใช้คลาส Parser
- รับข้อความที่จัดรูปแบบของไฟล์ที่โหลดโดยใช้คลาส FormattedTextOptions และโหมด Markdown
- อ่านเนื้อหาทั้งหมดโดยใช้เมธอด readToEnd
- แปลงเป็นรูปแบบมาร์กดาวน์โดยเขียนเนื้อหาลงในไฟล์ MD โดยใช้วิธีเขียนของคลาส FileWriter
ซอร์สโค้ด Java ต่อไปนี้แปลง MS Word เป็นไฟล์ Markdown
import java.io.FileWriter;
import java.io.IOException;
import com.groupdocs.parser.Parser;
import com.groupdocs.parser.data.*;
import com.groupdocs.parser.options.*;
...
...
try (Parser parser = new Parser("/path/document.docx")) {
try (TextReader reader = parser.getFormattedText(new FormattedTextOptions(FormattedTextMode.Markdown))) {
String content = reader.readToEnd();
try {
FileWriter myWriter = new FileWriter("/path/word-to-markdown.md");
myWriter.write(content);
myWriter.close();
}
catch (IOException e) {
e.printStackTrace();
}
}
}
รับใบอนุญาต API ฟรี
คุณสามารถรับ ใบอนุญาตชั่วคราวฟรีเพื่อใช้ API โดยไม่มีข้อจำกัดในการประเมิน
บทสรุป
โดยสรุป เราเรียนรู้การแปลงไฟล์ Word เป็นรูปแบบมาร์กดาวน์ใน Java ภายในแอปพลิเคชัน คุณสามารถใช้คุณสมบัตินี้ภายในแอปพลิเคชันของคุณ คุณสามารถขยายแอปพลิเคชันของคุณได้โดยใช้คุณสมบัติอื่นๆ ที่มีของ API
เรียนรู้เพิ่มเติมเกี่ยวกับ Java Parser API โดยใช้ เอกสารประกอบ และสัมผัสกับตัวอย่างที่มีอยู่ใน GitHub ติดต่อเราสำหรับคำถามใด ๆ ผ่านทาง ฟอรัม