Blog Details

  • Home
  • Evolution des Bubble Charts

Evolution des Bubble Charts

Eine Herausforderung bei der Datenvisualisierung ist oft die Abbildung von mehreren Dimensionen in einer Grafik. Eine spannende Art von Visualisierungstyp ist das Bubble Chart. Hier werden mindestens drei verschiedene Dimensionen abgebildet und bietet Potential für mehr. Wir zeigen den Start mit einem Scatterplot und das Potential zu 8 Dimensionen hin. Aber Achtung, Spoiler: Nicht alles was möglich ist, macht auch Sinn. Wir stellen die Evolution des Bubble Charts anhand eines Beispiels vor.

Das Bubble Chart

Die wohl grösste Perle an Visualisierungsbeispielen ist die Darstellung von Hans Rosling der Lebenserwartung von 200 Länder über 200 Jahre – Mit einem Bubble Chart! Wer es noch nicht kennt, dem seien die 4min wärmstens empfohlen: Hans Rosling’s 200 Countries, 200 Years, 4 Minutes – The Joy of Stats – BBC Four – YouTube

Ein Bubble Chart beinhaltet Punkte auf zwei Achsen, mit unterschiedlichen Grössen (eine zusätzlich numerische Dimension). Im Beispiel von Hans Rosling gibt es pro Land ein Punkt und folgende Dimensionen: Lebenserwartung (numerische Y-Achse), Einkommen (numerische X-Achse), Anzahl Einwohner (Grösse der Bubbles), Kontinente (Farbe der Bubbles), Jahreszahl (Animation).

Der Ursprung liegt im Scatterplot

Ein Scatterplot (oder Streudiagramm) ist eine Darstellung von Datenpunkten auf zwei Achsen. Ziel ist es dabei, eine Beziehung zwischen den zwei Dimensionen auf den Achsen darzustellen, um darin ein Muster oder ein Korrelation zu erkennen. Daraus können dann Ableitungen oder gar Voraussagen in die Zukunft gemacht werden. Unser Beispiel zeigt nachfolgend die Verteilung einer Schule von Abschlussnoten und den dafür aufgewendeten Stunden (fiktiven Daten). Mit Hilfs- oder Trendlinien kann zudem auf einige Insights hingewiesen werden (Grafik rechts mit dem Hinweis, dass bei allen Studierenden mit Note 4+ mindestens 170h aufgewendet worden sind). Nicht ganz überraschend ergibt es eine Korrelation zwischen aufgewendeten Stunden und erzieltem Abschluss – Fleiss zahlt sich also aus (Anm. in der Schweiz gilt die Note 4 als bestanden, Note 6 ist die Maximalnote).

Scatterplot
Scatterplot mit zwei Achsen (und Hilfslinien rechts)

Die Punkte werden grösser

Im Scatterplott sind die einzelnen Datenwerte (in dem Fall Studierende) gleich gross. Ein weiterer numerischer Wert kann nun hinzugefügt werden, um die Grösse der Punkte zu steuern. In unserem Beispiel fügen wir die Anzahl Jahre an Erfahrung, welche die Studierenden im jeweiligen Lehrgang, mit an.

Evolution des Bubble Charts
Das Bubble Chart mit unterschiedlich grossen Punkten

Die unterschiedliche Grösse der Punkte (Bubbles) ergibt eine weitere Möglichkeit zur Mustererkennung in der Streuung. Hier könnte man zum Beispiel schlussfolgern, dass mehrere Jahre an Berufserfahrung zu einem besseren Abschluss verhelfen können. Dies könnte dann bei einer Studienberatung oder Aufnahmekriterien entsprechend thematisiert werden oder das Angebot richtet sich dann eher an ein erfahreneres Publikum.

Kategorien als weitere Dimensionen

Bisher haben wir ausschliesslich numerische Werte in unserem Bubble Chart drin. Um Kategorien als Dimensionen zu verwenden, kann man weitere Anpassungen vornehmen. Eine Möglichkeit besteht darin, unterschiedliche Farben pro Kategorie zu verwenden. Hier ist es wichtig, dass es a) nicht zu viele verschiedene Farben sind, damit man die Unterschiede erkennt und b) Farben verwendet, die auch Personen unterscheiden können, die bezüglich Farberkennung eingeschränkt sind.

Eine weitere Möglichkeit ergibt sich aus unterschiedlichen Marker-Formen, also z.B. Kreise und Kreuze. Hier gilt das gleiche wie bei den Farben: Zu viele unterschiedliche Formen sind unübersichtlich.

Theoretisch kann man diese zwei Möglichkeiten auch verbinden, um mehrere Dimensionen zu verwenden. In der Praxis führt das aber oft dazu, dass die einzelnen Werte schwierig zu unterscheiden sind.

Alternativ kann man mit sogenannten “Small Multiples” eine zusätzliche Dimension reinbringen, ohne dass die Übersicht verloren geht. Untenstehendes Beispiel zeigt anstelle unterschiedlicher Marker-Formen ein Small Multiples für die Dimension “Methoden”. Wichtig dabei: Skala von X- und Y-Achsen sind identisch, so ist ein Vergleich der Charts möglich.

Small Multiples
Small Multiples

Animation über die Zeit

Oftmals wir eine Dimension über die Zeit als Vergleichsfaktor gewünscht. Ein Jahr z.B. kann man gut auch als Kategorie verwenden, wenn es nicht allzu viele sind. Sobald es mehr sind oder die Granularität auf Monate, Wochen oder gar Tage sinkt, so kann sich eine Animation über die Zeit lohnen. Entweder als Filtermöglichkeit oder je nach Analytics Tool als lauffähige Animation.

Animation über die Jahre 2021 und 2022

Ab ins Metaverse?

Bisher bewegen wir uns trotz mehreren Datenwerte und Dimensionen immer noch auf zwei Achsen, einer X- und einer Y-Achse. Die Z-Achse bringt uns klassischerweise ins 3D-Land. Ist das eine gute Idee? Nun, damit bekommen wir natürlich eine weitere Dimension in unser Chart rein. Es wird aber auch immer schwieriger aus dem Chart etwas heraus zu lesen. Wenn sich in den drei Dimensionen klare von sich getrennte Clusters befinden, kann das noch möglich sein. Ansonsten stehen wir mit unserer räumlichen Orientierung an einem schwierigen Ort – erst recht, wenn wir bereits unterschiedliche grosse Punkte, Marker und Farben verwenden. Gerade in der Business Analyse sollten solche komplexen Modelle nicht nötig sein (das sieht in anderen wissenschaftlichen Gebieten anders aus), Erkenntnisse müssen schnell auf den Punkt gebracht werden.

Wie das in Zukunft aussieht, wenn sich Konzepte wie das Metaverse und einer “neuen” räumlichen Welt tatsächlich durchsetzen könnten, müsste neu bewertet werden. Vielleicht haben wir uns dann daran gewöhnt, Dinge mit einer AR oder VR zu Gemüte zu führen.

Fazit

Zwei Achsen, Punktgrösse, Markertyp, Farben, Small Multiple, Animation und schliesslich die Z-Achse: Dies bringt uns zu acht Dimensionen, die sich mit einem Bubble Chart darstellen lassen. Wie an mancher Stelle betont, ist es unabdingbar, die Lesbarkeit der Grafik und die schnelle Erfassung von Erkenntnissen zu garantieren. In diesen Fällen lieber Dimensionen weglassen und stattdessen mit Filter arbeiten.

Weitere Tipps rund um die Verwendung von Grafiken finden Sie in diesem Beitrag: 7 Tipps bei der Auswahl von Charts