以前、[分析を自動化し、完全なドキュメントをプログラムで分類する]方法について説明しました2。多くの場合、ドキュメントの一部または少数のステートメントのみを分類する必要があります。この記事では、選択したテキストの可能な限り最良の分類学的カテゴリーを特定します。 ** IAB-2に従ってテキストを分類し、C#を使用して分類を文書化する方法**を学習します。
以下のトピックについて説明します。
-テキストの分類学的分類のための.NETAPI -C#を使用したIAB-2分類法によるテキスト分類 -C#を使用したドキュメント分類によるテキスト分類
テキストの分類学的分類のための.NETAPI
GroupDocs.Classification for .NETは、.NETアプリケーション内のテキストコンテンツを分類するためのさまざまな手法を可能にするAPIです。このAPIを使用して、例でC#を使用して、提供されたテキストの可能な限り最良の分類カテゴリを見つけます。
ダウンロードセクションからDLLまたはMSIインストーラーをダウンロードするか、NuGetを介して.NETアプリケーションにAPIをインストールできます。
PM> Install-Package GroupDocs.Classification
C#を使用したIAB-2タクソノミーによるテキスト分類
IAB-2は、コンテンツを定義済みの分類カテゴリに分類し、分析に基づいて分類します。以下は、C#を使用したIAB-2分類によるテキストの分類分類の手順です。
- Classifierクラスを使用して分類子をインスタンス化します。
- 分類学的分析のテキストを定義します。
- TaxonomyをIAB2に設定します。
- 分類の結果として最良の結果カウントの数を設定します。 (オプション)
- 定義されたパラメータを使用してClassifyメソッドを呼び出すことにより、提供されたテキストの分類カテゴリを取得します。
- ClassifyメソッドのclassificationresponseからBestResultsを出力します。
次のC#ソースコードは、** IAB-2分類法**を使用してテキストを分類し、最も一致する上位のカテゴリを取得する方法を示しています。
/*
* C#を使用してIAB-2タクソノミーでテキストを分類する
*/
Classifier classifier = new Classifier();
string statement = "Medicine is an important part of our lives";
var response = classifier.Classify(statement, 3, Taxonomy.Iab2);
response.BestResults.ToList().ForEach(bestResult => Console.WriteLine($"Class: {bestResult.Name}, \tProbability: {bestResult.Probability}"));
Class: Healthy\_Living, Probability: 0.4144087
Class: Medical\_Health, Probability: 0.2108202
Class: Science, Probability: 0.1584931
C#を使用したドキュメント分類によるテキスト分類
ドキュメント分類は、コンテンツをさまざまなドキュメントクラスに分類します。たとえば、広告、請求書、ニュース、履歴書、手紙、電子メールなどです。以下は、C#を使用したドキュメント分類によるテキストの分類分類の手順です。
- 分類子をインスタンス化します。
- 分類学的分析のためにテキストをロードします。
- 分類の結果としてカウントされる最良の結果の数を定義します。 (オプション)
- 分類法をドキュメントとして設定します。
- 上記で定義されたパラメータを使用してClassifyメソッドを呼び出して、分類グループを取得します。
- ClassifyメソッドのclassificationresponseからBestResultsを出力します。
次のC#ソースコードは、テキストコンテンツを分類し、ドキュメント分類を使用してその上位の分類カテゴリのいくつかを取得する方法を示しています。
/*
* C#を使用してドキュメント分類法でテキストを分類する
*/
Classifier classifier = new Classifier();
string statement = "Sooner or later technology will overcome labor work";
var response = classifier.Classify(statement, 2, Taxonomy.Documents);
response.BestResults.ToList().ForEach(bestResult => Console.WriteLine($"Class: {bestResult.Name}, \tProbability: {bestResult.Probability}"));
Class: ADVE, Probability: 0.9999645
Class: Report, Probability: 3.461805E-05
無料ライセンスを取得する
評価の制限なしにAPIを使用するために、無料の一時ライセンスを取得できます。
結論
要約すると、さまざまな分類法を使用してさまざまな種類のドキュメントを分類することを学びました。例では、IAB-2に従ってテキストを分類し、C#を使用してドキュメントの分類を分類しました。一連の投稿を読んだ後、独自の.NET分類アプリケーションを作成してドキュメントを分類したり、さまざまな分類法や構成のテキストを作成したりできます。
APIの詳細については、ドキュメントにアクセスしてください。お問い合わせは、フォーラムまでお問い合わせください。