Als Standard Visual kann man das Sankey-Diagramm nicht bezeichnen. Neben Säulen, Linien und Kuchen erscheint es geradezu exotisch. Und dennoch trifft man das Diagramm immer öfters an und wir gewöhnen uns automatisch an die Art Darstellung eines Datenfluss. Was das Sankey-Diagramm ist und wann es sinnvoll ist, es einzusetzen, zeigen wir in diesem kurzen Beitrag.
Es war einmal…
…ein irischer Ingenieur namens Sankey, der den Zu- und Abfluss von Wärme in Dampfmaschinen darstellen wollte. Er stellte die einzelnen Flüsse proportional zu ihrer Menge dar. Diese Art von Visualisierung erlaubt es einen komplexen Sachverhalt auf einfache Weise darzustellen. Das Sankey-Diagramm, wie wir es heute kennen, wurde daraufhin nach ihm benannt.
Bereits zuvor gab es einen bekannten Vorläufer: die Darstellung von Minard, welcher den Russlandfeldzug von Napoleon zeigt. Auch wenn hier noch mehr Dimensionen drin sind, erinnert der Fluss der Armee und dessen Verluste ebenfalls an ein Sankey-Diagramm.
Das Sankey-Diagramm für Kostenverteilung
Die Darstellung von Mengenflüssen über Stages oder Komponenten eignet sich für einige Use Cases. Ein Beispiel sind Budget- oder Kostenaufteilungen. Verschiedene Einnahmequellen auf der einen Seite, Zwischenstationen in der Mitte und die Ausgabepositionen auf der anderen Seite.
Hier sehen wir aus aktuellem Anlass die Kosten und Finanzierung des Gesundheitswesen in der Schweiz im Jahr 2022 (Quelle bfs). Man erkennt welche Anteile aus den Quellen (privat, Bund, Kanton, etc.) an die Finanzregime fliessen. Diese wiederum finanzieren dann die Leistungserbringer. Moderne Tools erlauben durch ihre Interaktivität zudem den Fokus auf eine bestimmte Komponente zu legen. Wenn man in der untenstehenden Grafik mit der Maus über die Komponente “Selbstzahlungen” fährt (Komponente in der Mitte), wird durch Highlighten gezeigt, woher das Geld kommt und wohin es fliesst. Mit dem Tooltip sehen wir zudem den Kostenbetrag für diese Komponente.
Datenfluss in Sales & Marketing
Eine weitere Möglichkeit für die Verwendung eines Sankey-Diagramms ist die Sales Pipeline. Klassischerweise kennt man den Funnel mit verschiedenen Stages, von der Lead-Generierung bis zum erfolgreichen Abschluss, bilden die Werte ein Trichter. Die Darstellung nach Sankey erlaubt nicht nur die erfolgreichen Verläufe zu zeigen, sondern auch was mit jenen passiert, die unterwegs verloren gehen. So können verlorene Leads/Opportunities/etc. weiter analysiert und visualisiert werden.
Ein ähnlicher Verlauf ist bei Websites möglich: Welchen Verlauf nimmt ein Website-Besucher von der Start/Landing Page, bis ein Produkt verkauft wird? Von wo kommt er her, springt er bereits bei der Landing Page ab, steigt er im Warenkorb aus oder beim Ausfüllen der Kreditkarten-Angaben? Je nach Analyse können die Anbieter der Website überdenken, ob die Landing Page besser ausgebaut werden soll oder die Benutzerfreundlichkeit bei der eigentlichen Bestellung. Obwohl die erfolgreichen Abschlüsse das Ziel sind, interessieren vor allem die nicht erfolgreichen Abschlüsse und die Suche nach dem Warum.
Stages und Links
Die Voraussetzung, um ein solches Diagramm zu erstellen ist eine Sammlung von Stages (Nodes, Knoten, Komponenten), die miteinander in Beziehung stehen (Links). So ergeben sich die Verbindungen. Im Beispiel oben enthält das Datenset also ein Verbindung von “Lead” (Start) und “Opportunity” (Ziel). Eine weitere Verbindung ist “Opportunity” (Start) und “Offer” (Ziel). So entsteht der Flow von den einzelnen Stages. Die Gewichtung ergibt dann die Breite des Flusses. So ist die Verteilung auch ohne genau Anzahl ersichtlich.
Ein Sankey-Diagramm macht also dann Sinn, wenn ein gewisser Datenfluss vorhanden ist und die Komponenten zueinander in einer Beziehung stehen. Gibt es sehr viele Komponenten oder gibt es Rückläufe zwischen den Stages, kann ein solches Diagramm auch unübersichtlich werden. Die Lesbarkeit sollte immer im Fokus bleiben. Dennoch lädt dieses Chart zum Verweilen und Erkunden ein und darf ruhig mal ausprobiert werden.