早些時候,我們討論瞭如何以編程方式自動化分析並對完整文檔進行分類。通常只需要對文檔的某些部分或少數語句進行分類。在本文中,我們將確定所選文本的最佳分類類別。我們將學習如何根據 IAB-2 對文本進行分類,並使用 C# 進行文檔分類。

以下主題涵蓋如下:

用於文本分類學分類的 .NET API

GroupDocs.Classification for .NET 是允許使用不同技術對 .NET 應用程序中的文本內容進行分類的 API。我們將使用此 API 在示例中使用 C# 查找所提供文本的最佳分類類別。

您可以從 下載部分 下載 DLL 或 MSI 安裝程序,或通過 NuGet 在您的 .NET 應用程序中安裝 API。

PM> Install-Package GroupDocs.Classification

使用 C# 的 IAB-2 分類法文本分類

IAB-2 將內容分類為定義的分類類別,然後根據分析對其進行分類。以下是使用 C# 對具有 IAB-2 分類法 的文本進行分類學分類的步驟。

  • 使用 Classifier 類實例化分類器。
  • 定義分類分析的文本。
  • 分類 設置為 IAB2。
  • 將最佳結果數設置為分類結果。 (可選的)
  • 通過使用定義的參數調用 Classify 方法來獲取所提供文本的分類類別。
  • 從 Classify 方法的 classification response 打印 BestResults

以下 C# 源代碼顯示瞭如何使用 IAB-2 分類法對文本進行分類並獲得最匹配的頂級類別。

/*
* 使用 C# 使用 IAB-2 分類法對文本進行分類
*/
Classifier classifier = new Classifier();
string statement = "Medicine is an important part of our lives";

var response = classifier.Classify(statement, 3, Taxonomy.Iab2);
response.BestResults.ToList().ForEach(bestResult => Console.WriteLine($"Class: {bestResult.Name}, \tProbability: {bestResult.Probability}"));
 Class: Healthy\_Living,      Probability: 0.4144087
 Class: Medical\_Health,     Probability: 0.2108202
 Class: Science,                 Probability: 0.1584931

使用 C# 的文檔分類法文本分類

文檔分類法將內容分為不同的文檔類別,如廣告、發票、新聞、簡歷、信件、電子郵件等。以下是使用C#對文檔分類法文本進行分類的步驟。

  • 實例化分類器
  • 加載用於分類分析的文本。
  • 定義作為分類結果的最佳結果數。 (可選的)
  • Taxonomy 設置為文檔。
  • 通過使用上述定義的參數調用 Classify 方法來獲取分類組。
  • 從 Classify 方法的 classification response 打印 BestResults

以下 C# 源代碼顯示瞭如何使用文檔分類法對文本內容進行分類並獲取其一些頂級分類類別。

/*
* 使用 C# 使用文檔分類法對文本進行分類
*/
Classifier classifier = new Classifier();
string statement = "Sooner or later technology will overcome labor work";

var response = classifier.Classify(statement, 2, Taxonomy.Documents);
response.BestResults.ToList().ForEach(bestResult => Console.WriteLine($"Class: {bestResult.Name}, \tProbability: {bestResult.Probability}"));
 Class: ADVE,      Probability: 0.9999645
 Class: Report,     Probability: 3.461805E-05

獲得免費許可證

您可以獲得免費的臨時許可證,以便在不受評估限制的情況下使用 API。

結論

總而言之,我們學會了使用不同的分類法對各種文檔進行分類。在示例中,我們根據 IAB-2 對文本進行分類,並使用 C# 對文檔進行分類。閱讀完本系列文章後,您可以構建自己的 .NET 分類應用程序來 分類文檔 以及具有不同分類法和配置的文本。

有關 API 的更多信息,請訪問 文檔。如有疑問,請通過論壇 聯繫我們。

也可以看看