Taxonomische Klassifizierung von Rohtext mit C# – (IAB-2 & Dokumententaxonomie)
In einem Artikel haben wir diskutiert, wie wir [komplette Dokumente programmatisch analysieren und klassifizieren können][1]. Oft ist es erforderlich, nur einen Teil des Dokuments oder nur wenige Aussagen zu klassifizieren. In diesem Artikel identifizieren wir die bestmöglichen taxonomischen Kategorien des ausgewählten Textes. Wir werden lernen, wie wir Text nach IAB-2 klassifizieren und Taxonomien mit C# dokumentieren können.
Taxonomische Klassifizierung von Dokumenten mit C# - (IAB-2 & Dokumententaxonomie)
Eine Klassifikation ist im Grunde ein Ansatz, bei dem Text systematisch identifiziert und dann nach Regeln organisiert wird. Die Taxonomie definiert die Wissenschaft einer solchen Klassifikation. Wenn Sie es mit einer Reihe von Textdokumenten zu tun haben, wird es schwierig, ein Thema für ein Dokument zu finden, bis die taxonomische Klassifizierung des Inhalts erfolgt ist. In diesem Artikel erfahren Sie, wie Sie mit C# Dokumente programmgesteuert gemäß IAB-2 klassifizieren und die Taxonomie von Dokumenten verwenden.