המרת מסמך Word ל-Markdown ב-Java

התמיכה בקובצי סימון על ידי עורכי עיבוד תמלילים הגדילה את השימוש בו בקנה מידה גדול. לפיכך, לעתים קרובות נדרשת המרה של תוכן טקסט קיים לפורמט סימון. מאמר זה דן כיצד להמיר באופן תכנותי מסמכי Word לקובצי סימון ב-Java. לאחרונה, כבר דנו בכמה מהנושאים הקשורים הבאים:

Java API לניתוח והמרת קבצי Markdown

GroupDocs מספקת ממשקי API המאפשרים ניתוח מסמכי Word והמרתם לפורמטים אחרים בתוך יישומים. נשתמש ב-Java API שלו כדי לנתח ולהמיר קובצי Word DOC/DOCX לקבצי MD. יתר על כן, ה-API תומך בניתוח פורמטים רבים אחרים של קבצים כמו קובצי PDF, גיליונות אלקטרוניים, מצגות, ספרים אלקטרוניים, מסמכי סימון, הודעות דואר אלקטרוני, תמונות ועוד רבים אחרים המוזכרים בתיעוד.

אתה יכול להוריד את קובץ ה-JAR מסעיף ההורדות או להשתמש בתצורות המאגר והתלות העדכניות ביותר בתוך יישומי Java המבוססים על Maven.

<repository>
    <id>groupdocs-artifacts-repository</id>
    <name>GroupDocs Artifacts Repository</name>
    <url>https://releases.groupdocs.com/java/repo/</url>
</repository>
<dependency>
    <groupId>com.groupdocs</groupId>
    <artifactId>groupdocs-parser</artifactId>
    <version>22.6</version>
</dependency>

כיצד להמיר Word ל-Markdown ב-Java

למה לא פשוט לעבור ישר לנושא העניין שלך ובואו נהפוך את מסמך Microsoft Word לפורמט סימון? השלבים הבאים מראים כיצד להמיר את Word DOC/DOCX ל-Markdown ב-Java.

  • טען את קובץ MS Word באמצעות המחלקה Parser.
  • קבל את הטקסט המעוצב של הקובץ הנטען באמצעות המחלקה FormattedTextOptions ומצב Markdown.
  • קרא את התוכן המלא בשיטת readToEnd.
  • המר אותו לפורמט סימון על ידי כתיבת התוכן לקובץ MD בשיטת הכתיבה של מחלקה FileWriter.

קוד המקור של Java הבא ממיר את MS Word לקובץ Markdown.

import java.io.FileWriter;
import java.io.IOException;
import com.groupdocs.parser.Parser;
import com.groupdocs.parser.data.*;
import com.groupdocs.parser.options.*;
...
...
try (Parser parser = new Parser("/path/document.docx")) {
    try (TextReader reader = parser.getFormattedText(new FormattedTextOptions(FormattedTextMode.Markdown))) {
        String content = reader.readToEnd();
        try {
            FileWriter myWriter = new FileWriter("/path/word-to-markdown.md");
            myWriter.write(content);
            myWriter.close();
        }
        catch (IOException e) {
            e.printStackTrace();
        }
    }
}

קבל רישיון API בחינם

אתה יכול לקבל רישיון זמני בחינם לשימוש ב-API ללא מגבלות ההערכה.

סיכום

לסיכום, למדנו להמיר קבצי וורד לפורמט סימון ב-Java בתוך האפליקציות. אתה יכול להשתמש בתכונה זו בתוך היישום שלך. אתה יכול להרחיב את היישום שלך באמצעות תכונות זמינות אחרות של ה-API.

למד עוד על Java Parser API באמצעות תיעוד שלו ועל ידי התנסות בדוגמאות הזמינות ב-GitHub. צור איתנו קשר לכל שאלה דרך הפורום.

ראה גם