Was ist ein Star Schema?

Wenn wir ein Power BI-Dashboard betrachten, sehen wir Diagramme, Filter und interaktive Visualisierungen. Was wir nicht sehen, ist das Fundament, das all dem zugrunde liegt: ein durchdachtes Datenmodell. Und genau hier kommt das Star Schema ins Spiel. Es ist ein einfaches, aber wirkungsvolles Konzept, das nicht nur Ordnung in die Daten bringt, sondern auch die Basis schafft für performante und verlässliche Analysen.

Was versteht man unter dem Star Schema?

Das Star Schema (zu Deutsch “Sternschema”) ist eine Methode, wie man Daten übersichtlich strukturieren kann. Dabei sieht die Anordnung aus wie ein Stern: In der Mitte stehen die Fakten und Zahlen. wie z.B. Umsatz, Transaktionen oder Buchungen. Drumherum werden wichtige Informationen angeordnet, die zu diesen Zahlen gehören, wie z.B. Kundeninformationen, Produkte, Datum und Zeit, etc. Diese Informationen nennt man Dimensionen. Diese sternförmige Anordnung hilft, Daten schnell auszuwerten und verständlich darzustellen. In der Data Analytics ist dies umso wichtiger, da Tools wie Power BI auf das Star Schema optimiert sind.

Folgendes Beispiel zeigt ein einfaches Modell eines Supermarkts: Jede Transaktion ist wie eine Quittung, unsere Faktentabelle. Auf dieser Quittung stehen Daten wie z.B. was verkauft wurde, welcher Betrag, welches Datum, etc. Damit wir die Transaktion besser analysieren, brauchen wir zusätzliche Informationen:

Wer hat eingekauft? Das ist die Kundendimension.
Was wurde gekauft? Die Produktdimension.
Wer hat den Verkauf gemacht? Die Mitarbeiterdimension.
Wo fand der Verkauf statt? Das ist die Shop-Dimension.
Wann wurde der Verkauf gemacht? Die Datumsdimension

Diese Informationen stehen nicht zwingend auf der Quittung, sind aber im Hintergrund über Verknüpfungen erreichbar. Ein Star Schema dazu würde dann wie folgt aussehen:

Genau so funktioniert nun dieses Modell: In der Mitte steht die “Quittung”, also die Transaktion (Fakten-Tabelle), und die umliegenden Informationen (Dimensionstabellen) liefern wichtige Details dazu, welche Datenanalysten besonders interessieren.

Relationale Datenbanken und Normalisierung

Diese Struktur mit zentralen Transaktionen und mehreren angehängten „Nachschlagewerken“ spiegelt genau das wider, wie relationale Datenbanken funktionieren: Daten werden in mehreren, logisch verknüpften Tabellen gespeichert. Diese Tabellen haben Spalten und Zeilen, ähnlich wie wir es von Excel-Tabellen kennen. Die Tabellen stehen untereinander in Beziehungen (Relationen). So kann es z.B. eine Tabelle Transaktion und eine Tabelle Produkt geben. Jede Transaktion bezieht sich auf ein Produkt, womit die Tabellen zueinander in einer Beziehung stehen. Die Tabellen werden über Keys (Schlüssel) miteinander verbunden.

In vielen operativen Systemen, wie z. B. ERP- oder Buchhaltungssystemen, sind die Daten stark normalisiert. Das heisst: Informationen sind auf viele kleine Tabellen verteilt, um Redundanzen zu vermeiden und Daten sauber zu halten.

Für Analysezwecke ist diese Struktur aber oft zu komplex und langsam. Deshalb wird in Data Warehouses oder BI-Tools wie Power BI meist ein vereinfachtes Modell wie das Star Schema verwendet. Es ist übersichtlicher, performanter und lässt sich leichter von Fachanwendern verstehen und nutzen. Um ein paar Relationen kommen wir aber dennoch nicht herum.

Wie sieht das nun in Power BI aus?

Wenn wir nun ein Analytics Tool wie Power BI nutzen, dann bauen wir die Daten in eben so einem Schema auf. Wie wir die Daten einbinden, hängt davon ab, wie wir sie aus der Quelle erhalten. Idealerweise nutzen wir ein bereits vorhandenes Data Warehouse oder die Tabellen sind bereits einzeln verfügbar, so dass wir sie nur noch korrekt in Relation setzen müssen. Falls wir eine einzige grosse Tabelle haben, dann müssen wir sie zuerst im Pre-Processing (z.B. in Power Query) auseinandernehmen. Wichtig ist nun, dass wir die Fakten-Tabelle ins Zentrum setzen:

Star Schema in Power BI — Star Schema mit drei Dimensionen

Aus Analytics-Sicht möchten wir Dimensionen nutzen, um zu gruppieren, zu aggregieren oder zu filtern. Die Fakten sind dann die Werte, die wir berechnen möchten, also zählen, summieren oder Durschnitte berechnen.

Ein sauber aufgebautes Star Schema ist in Power BI nicht nur „nice to have“, sondern oft entscheidend dafür, dass DAX-Measures korrekt und effizient funktionieren. Mit einem Star Schema als Grundlage, fallen DAX Formeln einfacher aus (und die können auch so schon komplex genug werden). Das betrifft vor allem Zeitfunktionen, denn diese benötigen eine zusammenhängende, lückenlose Datumsdimension. Fehlt diese oder ist die Beziehung zur Faktentabelle nicht korrekt (z. B. keine 1:N-Beziehung), funktionieren diese Vergleiche nicht zuverlässig. Vergleiche mit Implementationen mit einer einzigen grossen Tabelle zeigen zudem, dass ein Star Schema massiv besser performt, gerade wenn es um Scaling geht, also grössere Datenmengen.

Fazit

Das Star Schema ist kein rein technisches Konzept, sondern ein praktisches Werkzeug für alle, die mit Daten arbeiten. Es sorgt für Transparenz, Performance und Flexibilität in der Datenanalyse. Gerade in Power BI ermöglicht es den effizienten Einsatz von DAX, saubere Zeitvergleiche und eine klare Trennung zwischen Zahlen (Fakten) und Kontext (Dimensionen).

Wer mit Daten arbeitet, sollte das Star Schema nicht nur kennen, sondern bewusst einsetzen, z.B. als Grundlage für fundierte Entscheidungen und nachhaltige BI-Lösungen.

Blog Details

Was ist ein Star Schema?

Was versteht man unter dem Star Schema?

Relationale Datenbanken und Normalisierung

Wie sieht das nun in Power BI aus?

Fazit