Scientia potestas est.
– Lucius Seneca

Zurück zur Übersicht

Clustering

Technologien

partitionierend / hierarchisch
Clusteringverfahren können entweder partitionierend oder hierarchisch arbeiten. Partitionierende Verfahren produzieren "flache" Cluster – es gibt also keine (Ähnlichkeits-)Beziehungen zwischen verschiedenen Clustern. Hierarchische Cluster erstellen – wie der Name bereits ausdrückt – hierarchisch strukturierte Cluster. Ein Cluster besteht daher aus weiteren Unterclustern. Partitionierende Clusteringverfahren werden beispielsweise bei dem Clustering von Ergebnislisten angewendet. Hierarchische Clusteringverfahren bieten vor allem bei großen Dokumentmengen einen Informationsgewinn im Vergleich zu den partitionierenden Verfahren: Bei der Betrachtung eines Clustering-Ergebnisses kann man bei den groben Strukturen beginnen und dann in einen beliebigen Teil des Clusters "hineinzoomen".

On-the-Fly Clustering
Siehe Ergebnis-Clustering

F-measure
Das F-measure ist ein Qualitätsmaß für Clusteringalgorithmen. Dabei dient die Ähnlichkeit der Dokumente innerhalb eines Clusters als Berechnungsgrundlage.