Portable Document Format (PDF) は、Adobe が開発した一般的で広く使用されているドキュメント形式です。 PDF ドキュメントには、書式設定されたテキスト、画像、注釈、フォーム フィールドなど、さまざまなコンテンツを含めることができます。PDF ドキュメントをプログラムで解析することは一般的なユース ケースであり、テキストを抽出する方法は複数あります。ただし、PDF ドキュメントから画像を抽出するのは複雑な作業です。この記事では、C# でプログラムを使用して PDF ドキュメントから画像を簡単に抽出できることを示します。
C#を使用してドキュメントから画像を抽出する
この記事では、ドキュメント解析.NET APIを使用して、C#アプリケーションでPDF、Excel、PowerPoint、およびWordドキュメントからプログラムで画像を抽出する方法を学習します。 [GroupDocs.Parser for .NET][1]は、ドキュメントの解析とデータ抽出の.NETAPIです。 ドキュメントの解析と画像、テキストの抽出、ワードプロセッシングドキュメント、スプレッドシート、プレゼンテーション、アーカイブからのメタデータをサポートします。 メールドキュメント。