Clusteranalyse
Als Teil der empirischen Sozialforschung bedient sich die Marktforschung ebenfalls unterschiedlicher Methoden zur Datengewinnung. Allen Methoden gemeinsam ist die Frage nach einer repräsentativen Stichprobe. Diese steht als Teilmenge für die Gesamtheit unter Anwendung bestimmter Gesichtspunkte. Ein anderes Verfahren zur Gewinnung von Datenstrukturen ist die Clusteranalyse. Hier geht es um ein vielfältiges Verfahren zur Entdeckung von Ähnlichkeitsstrukturen in Datenbeständen. Die Clusteranalyse ordnet einzelne untersuchte Personen oder Objekte mit einer ähnlichen Eigenschaftsstruktur einer Gruppe zu. Diese Eigenschaften können ähnliche Produktnutzung oder ein ähnlicher Bildungsgrad sein. Ein Cluster ist demzufolge eine Gruppe von ähnlichen Objekten, die Gruppenzuordnung bezeichnet man als Clustering. Die Marktforschung setzt Clusteranalysen häufig für eine Marktsegmentierung ein, wie etwa im Rahmen von Kundentypologien.
Arten der Clusteranalyse
Die Clusteranalyse gehört als Disziplin zum sogenannten Data-Mining (Daten-Schürfen) und hat das Ziel, völlig neue Gruppen in den gesammelten Daten zu erkennen. Die Clusteranalyse ist gewissermaßen das Gegenteil der Klassifikation, wo die Zuordnung von Daten zu bereits bestehenden Klassen erfolgt. Allerdings lassen sich die Cluster-Datengruppen anschließend einer automatisierten Klassifizierung zur Erkennung von Mustern in der Bildverarbeitung oder zur Marktsegmentierung unterziehen. Bei der Clusteranalyse ist es daher oft notwendig, verschiedene Verfahren und unterschiedliche Algorithmen zu verwenden, um eine aussagekräftige Datengruppierung zu erhalten. Eine weitere Möglichkeit ist es, verschiedene Parameter zu probieren, die Daten vorzuverarbeiten und beispielsweise Attribute auszuwählen oder wegzulassen.
Homogene und heterogene Cluster
Die Clusteranalyse lässt sich grob in homogene und heterogene Gruppierungen unterteilen. Wenn die einem Cluster zugeordneten Objekte möglichst ähnlich sind, spricht man von homogenen Gruppen. Wenn die unterschiedlichen Clustern zugeordneten Objekte möglichst stark voneinander unterscheiden, sind es heterogene Gruppen. Bei der Clusteranalyse lassen sich allerdings mehrere Merkmale von „Ähnlichkeit“ oder „Unähnlichkeit“ parallel zueinander zur Clusterbildung heranziehen. Anzumerken ist, dass es in keinem Fall eine einzige, „richtige“ Einteilungen in der Clusteranalyse gibt, sondern häufig mehrere Clustereinteilungen möglich sind und gleichermaßen Sinn machen.
Verfahren zur Clusteranalyse
Für die Clusteranalyse gibt es mehrere Verfahren, mit welchen sich eine Kombination aus Merkmalen eines Objekts mit anderen Objekten mit einer ebensolchen Kombination vergleichen lassen. Die am häufigsten verwendeten sind partitionierende und hierarchische Verfahren.
Partitionierende Verfahren
In diesem Verfahren gibt es eine gegebene Partitionierung und die Analyse ordnet deren Elemente durch Austauschfunktionen um, bis die verwendete Zielfunktion ein Optimum erreicht. Der Nachteil ist, dass keine zusätzlichen Gruppeneinteilungen möglich sind, da die Anzahl der Cluster bereits am Anfang feststeht.
Hierarchische Verfahren
Die Marktforschung verwendet meist hierarchische Verfahren als die bestmögliche für die Clusteranalyse. Dieses erfordert nur geringfügige Voraussetzungen und ist daher fast in jeder Situation anwendbar. Jedoch ist der Informationsgehalt des Ergebnisses geringer als bei anderen multivariaten Analyseverfahren wie Varianzanalyse oder Faktorenanalyse.
Das hierarchische Verfahren lässt sich nach der Berechnungsvorschrift in zwei wichtige Typen von Verfahren einteilen:
- Das divisive Clusterverfahren betrachtet zunächst alle Objekte als zu einem Cluster gehörig. Schrittweise folgt die Einteilung in immer kleinere Cluster, bis jeder davon nur noch aus einem Objekt besteht (Top-down-Verfahren).
- Das agglomerative Clusterverfahren bildet zunächst für jedes Objekt einen eigenen Cluster und fasst schrittweise die bereits gebildeten Cluster zu immer größeren zusammen und das so lange, bis alle Objekte zu einem einzigen Cluster gehören (Bottom-up-Verfahren). Agglomerative Verfahren kommen in der Praxis, etwa bei der Marktsegmentierung im Marketing, besonders häufig vor.
Für beide Verfahren gilt, dass einmal gebildete Cluster hinterher unverändert bleiben müssen. Die Struktur wird entweder divisiv verfeinert oder agglomerativ vergröbert, um eine strikte Cluster-Hierarchie zu bilden.