PDFまたはWord文書形式の表形式のデータがある場合は、必ずExcelスプレッドシートに変換する必要があります。このシナリオは、多くのスプレッドシートまたは複数のワークブックがある場合に複雑になります。あなたは確かにこの手順を自動化する必要があります。この記事では、PDFをExcelに変換する方法と、.NET APIを使用してC#でプログラムでWord文書をExcelスプレッドシートに変換する方法について説明します。

C#でWordとPDFをExcelに変換する

この記事で簡単に説明したトピックは次のとおりです。

  • .NET API –ドキュメントをスプレッドシートに変換
  • PDFをExcelに変換
  • WordをExcelに変換する
  • より多くのオプションを備えたPDFまたはWordからスプレッドシートへの変換

.NETAPI-スプレッドシート形式に変換

この記事では、GroupDocs.Conversion for .NETを使用して、C#を使用してPDFおよびWordドキュメントをスプレッドシートに変換します。これは、多くのファイル形式でのドキュメントと画像の変換を可能にする機能豊富なAPIです。一部の形式を強調するために、APIはワードプロセッシングドキュメント、スプレッドシート、プレゼンテーション、AutoCAD図面、eBook、PDF、電子メールファイル、Webページ、画像、フォトショップファイル、およびその他の多くのドキュメント形式をサポートしています。

ダウンロードセクションからDLLまたはMSIインストーラーをダウンロードするか、NuGetを介して.NETアプリケーションにAPIをインストールします。

PM> Install-Package GroupDocs.Conversion

C#でPDFをExcelに変換する

以下は、PDFドキュメントをExcelスプレッドシートに変換する手順です。

  • Converterクラスを使用してPDFファイルをロードします。
  • SpreadsheetConvertOptionsクラスを使用して変換オプションを初期化します。
  • オプションを指定してConverterクラスのConvertメソッドを呼び出します。

次のコードサンプルは、C#を使用してPDFファイルをExcelXLSX形式に変換する方法を示しています。

// PDFドキュメントをC#でExcelスプレッドシートに変換する
using (Converter converter = new Converter("document.pdf"))
{
    SpreadsheetConvertOptions options = new SpreadsheetConvertOptions();
    converter.Convert("outputpath/convertedSpreadsheet.xlsx", options);
}

C#でWordをExcelに変換する

上記のPDFファイルを変換したのと同じ方法で、任意のWord文書をExcelスプレッドシートに変換できます。 XLSまたはXLSXに変換するための適切なソースファイルを提供する必要があります。

以下は、DOCDOCX形式のWord文書をExcelスプレッドシートに変換する手順です。

  • Converterクラスを使用してWordファイルをロードします。
  • SpreadsheetConvertOptionsクラスを使用して変換オプションを初期化します。
  • オプションを指定してConverterクラスのConvertメソッドを呼び出します。

次のコードサンプルは、C#を使用してDOCまたはDOCXファイルをExcelXLSX形式に変換する方法を示しています。

// C#でWord文書をExcelスプレッドシートに変換する
using (Converter converter = new Converter("document.docx"))
{
    SpreadsheetConvertOptions options = new SpreadsheetConvertOptions();
    converter.Convert("outputpath/convertedSpreadsheet.xlsx", options);
}

C#を使用したより多くのオプションを備えたPDFまたはWordからスプレッドシートへの変換

ドキュメントの選択したページの一部のみを変換できます。 APIには、次のようなさまざまなオプションを使用してドキュメントを変換する権限があります。

  • 開始ページ番号
  • 変換するページ数
  • 変換用の特定のページ
  • 変換するフォーマット
  • ファイルを保護するためのパスワード
  • ズームして大きくしたり小さくしたりします。
  • コンバータファイルの透かし

以下は、C#を使用してPDFファイルの一部のページを異なるズームでXLSX形式に変換する方法の手順です。

// いくつかのオプションを使用して、PDFファイルの2ページ目をC#でExcelに変換します
using (Converter converter = new Converter("document.pdf"))
{
    SpreadsheetConvertOptions options = new SpreadsheetConvertOptions
    {
        PageNumber = 2,
        PagesCount = 1,
        Format = SpreadsheetFileType.Xlsx,
        Zoom = 150
    };
    converter.Convert("outputpath/convertedSpreadsheet.xlsx", options);
}

上記のコードを使用して出力されたPDFファイルと変換されたスプレッドシートを次に示します。 PDFファイルの2ページ目をXLSX形式に変換しました。

プログラムでPDFをExcelXLSXLSXに変換する

無料のAPIライセンスを取得する

評価の制限なしにAPIを使用するために、無料の一時ライセンスを取得できます。

結論

この記事では、C#を使用してExcelスプレッドシートのPDFおよびWord文書を変換する方法を学習しました。さらに、ズーム、透かし、パスワードで保護するなどのオプションを使用して、ドキュメントの任意の部分を変換する方法も確認しました。これで、独自の.NETベースのドキュメント変換アプリケーションの構築を開始したり、既存のアプリケーションに機能を統合したりできます。

詳細、オプション、および例については、ドキュメントおよびGitHubリポジトリにアクセスしてください。さらに質問がある場合は、フォーラムのサポートにお問い合わせください。

関連項目