이전에 프로그래밍 방식으로 전체 문서를 분석하고 분류할 수 있는 방법에 대해 논의했습니다. 문서의 일부 또는 몇 개만 분류해야 하는 경우가 많습니다. 이 기사에서는 선택한 텍스트의 가능한 최상의 분류 범주를 식별합니다. IAB-2에 따라 텍스트를 분류하고 C#을 사용하여 분류를 문서화하는 방법을 배웁니다.
다음 주제는 아래에서 다룹니다.
텍스트의 분류학적 분류를 위한 .NET API
GroupDocs.Classification for .NET은 .NET 애플리케이션 내에서 텍스트 콘텐츠를 분류하기 위한 다양한 기술을 허용하는 API입니다. 이 API를 사용하여 예제에서 C#을 사용하여 제공된 텍스트의 가능한 최상의 분류 범주를 찾습니다.
다운로드 섹션에서 DLL 또는 MSI 설치 프로그램을 다운로드하거나 NuGet을 통해 .NET 애플리케이션에 API를 설치할 수 있습니다.
PM> Install-Package GroupDocs.Classification
C#을 사용한 IAB-2 분류를 사용한 텍스트 분류
IAB-2는 콘텐츠를 정의된 taxonomic category로 분류한 다음 분석을 기반으로 분류합니다. 다음은 C#을 사용하여 IAB-2 taxonomy로 텍스트를 분류하는 단계입니다.
- Classifier 클래스를 사용하여 분류기를 인스턴스화합니다.
- 분류학적 분석을 위한 텍스트를 정의합니다.
- Taxonomy를 IAB2로 설정합니다.
- 분류 결과 베스트 결과 개수를 설정합니다. (선택 과목)
- 정의된 매개변수로 Classify 메서드를 호출하여 제공된 텍스트의 분류학적 범주를 가져옵니다.
- Classify 메서드의 분류 응답에서 BestResults를 인쇄합니다.
다음 C# 소스 코드는 IAB-2 분류법을 사용하여 텍스트를 분류하고 가장 잘 일치하는 상위 범주를 가져오는 방법을 보여줍니다.
/*
* C#을 사용하여 IAB-2 분류로 텍스트 분류
*/
Classifier classifier = new Classifier();
string statement = "Medicine is an important part of our lives";
var response = classifier.Classify(statement, 3, Taxonomy.Iab2);
response.BestResults.ToList().ForEach(bestResult => Console.WriteLine($"Class: {bestResult.Name}, \tProbability: {bestResult.Probability}"));
Class: Healthy\_Living, Probability: 0.4144087
Class: Medical\_Health, Probability: 0.2108202
Class: Science, Probability: 0.1584931
C#을 사용한 문서 분류로 텍스트 분류
문서 분류는 콘텐츠를 광고, 송장, 뉴스, 이력서, 편지, 이메일 등과 같은 다양한 문서 클래스로 분류합니다. 다음은 C#을 사용하여 문서 분류로 텍스트를 분류 분류하는 단계입니다.
- 분류기를 인스턴스화합니다.
- 분류학적 분석을 위해 텍스트를 로드합니다.
- 분류의 결과로 가장 좋은 결과 개수를 정의합니다. (선택 과목)
- Taxonomy를 Documents로 설정합니다.
- 위에서 정의한 매개변수로 Classify 메서드를 호출하여 분류 그룹을 가져옵니다.
- Classify 메서드의 분류 응답에서 BestResults을 인쇄합니다.
다음 C# 소스 코드는 문서 분류를 사용하여 텍스트 콘텐츠를 분류하고 상위 분류 범주 중 일부를 가져오는 방법을 보여줍니다.
/*
* C#을 사용하여 문서 분류로 텍스트 분류
*/
Classifier classifier = new Classifier();
string statement = "Sooner or later technology will overcome labor work";
var response = classifier.Classify(statement, 2, Taxonomy.Documents);
response.BestResults.ToList().ForEach(bestResult => Console.WriteLine($"Class: {bestResult.Name}, \tProbability: {bestResult.Probability}"));
Class: ADVE, Probability: 0.9999645
Class: Report, Probability: 3.461805E-05
무료 라이선스 받기
평가 제한 없이 API를 사용하기 위해 임시 무료 라이선스 받기를 할 수 있습니다.
결론
요약하자면, 우리는 다양한 분류법을 사용하여 다양한 종류의 문서를 분류하는 방법을 배웠습니다. 예제에서는 IAB-2에 따라 텍스트를 분류하고 C#을 사용하여 문서 분류를 분류했습니다. 일련의 게시물을 살펴본 후에는 문서 분류에 대한 고유한 .NET 분류 응용 프로그램을 구축할 수 있을 뿐만 아니라 다양한 분류 및 구성을 가진 텍스트도 만들 수 있습니다.
API에 대한 자세한 내용은 문서를 참조하십시오. 문의 사항은 포럼을 통해 문의해 주세요.