ワープロ ドキュメントは、このデジタル世界のほぼすべてのデバイスに存在します。同様に、ほぼすべてのワード プロセッシング エディタがマークダウン形式のサポートを開始しました。 Web ページとしての MD ファイルの継続的な増加により、Word コンテンツからマークダウン形式を使用した Web サイトへの変換が増加しています。この記事では、C# を使用してプログラムで Word ドキュメントをマークダウン ファイルに変換する方法について説明します。

C# で Word ドキュメントを Markdown に変換する

Markdown ファイルを解析および変換する .NET API

GroupDocs は、.NET アプリケーション内での Word ドキュメントの解析と他の形式への変換を可能にする .NET API を紹介しています。 GroupDocs.Parser for .NET を使用して、Word DOC/DOCX ファイルを解析し、MD ファイルに変換します。さらに、API は、PDF、スプレッドシート、プレゼンテーション、eBook、マークアップ ドキュメント、電子メール形式、アーカイブ、画像、および ドキュメント で言及されている他の多くのファイル形式の解析をサポートしています。

ダウンロード セクション から DLL または MSI インストーラーをダウンロードするか、NuGet 経由で .NET アプリケーションに API をインストールできます。

PM> Install-Package GroupDocs.Parser

C# を使用して Word を Markdown に変換する方法

すぐに目標にジャンプして、Microsoft Word ドキュメントをマークダウン形式に変換しましょう。次の手順は、C# を使用して Word DOC/DOCX を Markdown に変換する方法を示しています。

  • Parser クラスを使用して MS Word ファイルを読み込みます。
  • FormattedTextOptions クラスと Markdown モードを使用して、読み込まれたファイルの書式設定されたテキストを取得します。
  • ReadToEnd メソッドを使用して完全なコンテンツを読み取ります。
  • TextWriterクラスのWriteメソッドで内容をMDファイルに書き込んでMarkdown化します。

次の C# ソース コードは、MS Word docx ファイルを Markdown 形式に変換します。

using System.IO;
using GroupDocs.Parser.Options;
...
...
using (Parser parser = new Parser("/path/document.docx"))
{
    using (TextReader reader = parser.GetFormattedText(new FormattedTextOptions(FormattedTextMode.Markdown)))
    {
        string content = reader.ReadToEnd();
        using (TextWriter textWriter = File.CreateText("/path/word-to-markdown.md"))
        {
            textWriter.Write(content);
        }
    }
}

無料の API ライセンスを取得する

無料の一時ライセンスを取得して、評価制限なしで API を使用できます。

結論

要約すると、.NET アプリケーション内で C# を使用して、Word ファイルをマークダウン形式に変換する方法を学びました。この機能は、アプリケーション内で使用できます。 API の他の使用可能な機能を使用して、アプリケーションを拡張できます。

.NET Parser API の詳細については、ドキュメント を使用し、GitHub で利用可能な例を体験してください。 フォーラムからお問い合わせください。

関連項目