
ワード プロセッシング エディターによるマークダウン ファイルのサポートにより、その使用が大規模に増加しました。したがって、既存のテキスト コンテンツをマークダウン形式に変換することがしばしば要求されます。この記事では、Word 文書を Java のマークダウン ファイルにプログラムで変換する方法について説明します。最近、次の関連トピックのいくつかについてすでに説明しました。
Markdown ファイルを解析および変換するための Java API
GroupDocs は、アプリケーション内で Word ドキュメントを解析し、他の形式に変換できる API を提供します。その Java API を使用して、Word DOC/DOCX ファイルを解析し、MD ファイルに変換します。さらに、API は、PDF、スプレッドシート、プレゼンテーション、eBook、マークアップ ドキュメント、電子メール メッセージ、画像、およびドキュメントに記載されているその他多くのファイル形式の解析をサポートしています。
ダウンロード セクション から JAR ファイルをダウンロードするか、Maven ベースの Java アプリケーション内で最新のリポジトリと依存関係の構成を使用できます。
<repository>
<id>groupdocs-artifacts-repository</id>
<name>GroupDocs Artifacts Repository</name>
<url>https://releases.groupdocs.com/java/repo/</url>
</repository>
<dependency>
<groupId>com.groupdocs</groupId>
<artifactId>groupdocs-parser</artifactId>
<version>22.6</version>
</dependency>
Java で Word を Markdown に変換する方法
関心のあるトピックに直接移動して、Microsoft Word 文書をマークダウン形式に変換してみませんか?次の手順は、Java で Word DOC/DOCX を Markdown に変換する方法を示しています。
- Parser クラスを使用して MS Word ファイルを読み込みます。
- FormattedTextOptions クラスと Markdown モードを使用して、読み込まれたファイルの書式設定されたテキストを取得します。
- readToEnd メソッドを使用して完全なコンテンツを読み取ります。
- FileWriterクラスの write メソッドを使ってコンテンツを MD ファイルに書き込み、markdown 形式に変換します。
次の Java ソース コードは、MS Word を Markdown ファイルに変換します。
import java.io.FileWriter;
import java.io.IOException;
import com.groupdocs.parser.Parser;
import com.groupdocs.parser.data.*;
import com.groupdocs.parser.options.*;
...
...
try (Parser parser = new Parser("/path/document.docx")) {
try (TextReader reader = parser.getFormattedText(new FormattedTextOptions(FormattedTextMode.Markdown))) {
String content = reader.readToEnd();
try {
FileWriter myWriter = new FileWriter("/path/word-to-markdown.md");
myWriter.write(content);
myWriter.close();
}
catch (IOException e) {
e.printStackTrace();
}
}
}
無料の API ライセンスを取得する
評価制限なしで API を使用するための無料の一時ライセンス を取得できます。
結論
要約すると、アプリケーション内で Java の Word ファイルをマークダウン形式に変換する方法を学びました。アプリケーション内でこの機能を利用できます。 API の他の使用可能な機能を使用して、アプリケーションを拡張できます。
ドキュメント を使用し、GitHub で利用可能な例を体験して、Java パーサー API の詳細を確認してください。 フォーラムからお問い合わせください。