Ein Diagramm ist ein Storytelling-Tool, es bietet Dir die Möglichkeit Zusammenhänge in Deinen Daten anschaulich und leicht verständlich darzustellen.
Um das bestmögliche Ergebnis mit Deiner Visualisierung zu erzielen, ist es wichtig, dass Du den richtigen Diagrammtyp für Deine Daten wählst.
Alle, die beginnen sich ernsthaft mit Datenvisualisierung zu beschäftigen, stoßen am Anfang wohl unweigerlich auf die Herausforderung, wie man erkennen kann, wann welcher Diagrammtyp am besten geeignet ist.
Die Auswahl eines geeigneten Diagrammtyps ist keine exakte Wissenschaft, aber es gibt dennoch konkrete, allgemeingültige Regeln, welche Dir sehr nützlich sein können, um den geeignetsten Diagrammtyp für Deine Daten zu finden.
Um Dir dabei zu helfen, den richtigen Typ systematisch herauszufinden, habe ich in dieser 3-teiligen Artikelserie die 12 wichtigsten Diagrammtypen in der Geschäftswelt ganz genau unter die Lupe genommen.
Dabei zeige ich Dir die Vor- und Nachteile, die Eigenschaften, Anwendungsfälle und allgemeine Empfehlungen für jeden einzelnen Diagrammtyp auf.
All diese Diagrammtypen werden hauptsächlich für die Darstellung von Umsätzen, Soll-Ist-Vergleiche, Marketinganalysen, Personaldaten, Fragebogenauswertungen und alle sonstigen betriebswirtschaftlichen Daten verwendet.
Folgende zentrale Punkte wirst Du lernen:
1. Die wichtigsten Diagrammtypen im Geschäftsalltag kennen lernen
2. Wie Du den passenden Diagrammtyp für Deine Daten herausfindest
Ich weiß nicht, wie es Dir dabei geht, aber ich muss immer erst das Wesentliche zu einem Thema wirklich verstehen, damit ich im Stande bin, dass neu Gelernte auch sicher und selbstbewusst anwenden zu können.
Damit meine ich beispielsweise themenbezogene Begrifflichkeiten, welche oft wegen der vermeintlich allgemeinen Verständlichkeit gar nicht mehr erklärt werden. Doch fragt man dann konkret nach, wissen viele gar nicht was bestimmte Fachbegriffe überhaupt bedeuten.
Wenn es um Datenvisualisierung und um die Fähigkeit geht, den richtigen Diagrammtyp für Deine Daten zu finden, dann bin ich der Meinung sollte man unbedingt über die allgemeinen Merkmale von Diagrammen bescheid wissen. Das ist auch Voraussetzung um in diversen Softwareprogrammen, wie beispielsweise Excel, souverän sinnvolle Diagramme erstellen zu können.
Lass uns also zuerst einmal mit der Klärung wichtiger Begrifflichkeiten beginnen.
Die Elemente von Diagrammen
Ein Koordinatensystem schafft den äußeren Bezugsrahmen für ein Diagramm. Die meisten in der Geschäftswelt vorkommenden Diagramme werden im kartesischen und einige davon im polaren Koordinatensystem abgebildet.
Kartesische Koordinatensystem
Das kartesische System ist das bekannte x/y-Koordinatensystem. Es besteht aus zwei Linien, wobei die x-Achse die horizontale und die y-Achse die vertikale Linie repräsentiert.
Die x-Achse wird auch als unabhängige Variable (in Excel Rubrik- oder Kategorienachse) und die y-Achse als abhängige Variable (in Excel Größen- oder Werteachse) bezeichnet.
Die große Mehrzahl der Diagramme (Balken, Säulen, Linien, Flächen) werden in diesem Koordinatensystem dargestellt.
Abbildung 1: Beispiele für Daten der x- und y-Achse in einem Diagramm, rechtwinkelige Koordinaten
Polares Koordinatensystem
Kreisdiagramme (oft Tortendiagramme genannt) und Ringdiagramme (oft als Donut Diagramme bezeichnet) verwenden dieses System. Hier wird anstelle der Rubriken Achse ein Kreis eingesetzt, der im Gegensatz zu einer Achse keinen Anfangspunkt hat. Die Koordinaten liegen auf einem Radius und einem Winkel, sodass den verschiedenen Datengrößen unterschiedliche Winkelgrößen entsprechen.
Abbildung 2: Diagramm mit nicht rechtwinkeligen Koordinaten
Datenreihen und Datenpunkte
Die Daten einer Tabelle werden im einfachsten Fall durch Datenpunkte in einem Diagramm dargestellt. Je nach Diagrammtyp werden diese Punkte durch Balken, Säulen, Linien usw. ersetzt. In Excel wird daher ein Balken oder eine Säule auch als Datenpunkt bezeichnet. Jene Daten, welche dann am Ende zusammengehören, bilden jeweils eine Datenreihe. Eine Datenreihe enthält die Werte aus einer Spalte oder aus einer Zeile der Tabelle.
Abbildung 3: Säulen mit der gleichen Farbe zeigen die Datenreihe, die einzelnen Säulen einen Datenpunkt dieser Reihe
Damit ein Diagramm den Grundregeln von Storytelling mit Daten entspricht, muss es aussagekräftig dargestellt werden. Dazu ist es notwendig, alle Elemente eines Diagramms so zu beschriften, damit klar wird was eine Säule oder ein Balken überhaupt darstellen soll. Folgende Beschriftungen sollte ein Diagramm mindestens enthalten:
1) Diagrammtitel: beschreibend und nicht generisch, linke obere Ecke, linksbündig
2) Achsenbeschriftung: Werte sinnvoll angeben und skalieren
3) Achsentitel: was in welchen Einheiten ist mit den Achsen gemeint
4) Legende: wenn möglich Elemente direkt beschriften bzw. im Diagrammtitel angeben (ersetzt Legende); ansonsten Legende im linken oberen Bereich des Diagramms platzieren
Abbildung 4: Die Beschriftung erklärt die grafische Information
Soviel zu den wichtigsten Begrifflichkeiten.
TEIL 1
- Säulendiagramm
- Balkendiagramm
- Gruppiertes und gestapeltes Säulendiagramm
- Gruppiertes und gestapeltes Balkendiagramm
Diagrammtypen auswählen
Wenn Du also eine Tabelle in ein Diagramm umsetzen willst, stehst Du vor der Frage, welcher der vielen Diagrammtypen dafür am besten geeignet ist. Manchmal eignen sich mehrere Typen gut, ein anderes Mal gibt es nur den einen Diagrammtyp, der am besten geeignet ist.
Behalte bei der Auswahl immer folgende 2 Grundregeln im Hinterkopf:
- Diagramme dienen dem Zweck, Daten aus einer Tabelle leichter zugänglich zu machen. Das Diagramm soll überschaubarer sein und Zusammenhänge ersichtlich machen. Meide also überladene, unübersichtliche Diagramme
- Das Diagramm sollte die Daten korrekt wiedergeben. Achte auf richtige Skalierung der Achsen, beispielsweise bei Säulendiagrammen immer bei 0 starten.
Säulen- und Balkendiagramme
Säulen- und Balkendiagramme sind die beiden Diagrammtypen, welche wohl am häufigsten zum Einsatz kommen. Oft wird im allgemeinen Sprachgebrauch für beide Typen nur Balkendiagramm gesagt.
Der Unterschied zwischen den beiden Diagrammen liegt darin, dass beim Säulendiagramm die Säulen vertikal an der x-Achse ausgerichtet sind und beim Balkendiagramm die Balken horizontal an der y-Achse.
Die Länge der Säulen bzw. Balken ist proportional zu dem Wert, den es darstellt. Also ein Säulen- oder Balkendiagramm drückt den Wert in der Länge der Säulen bzw. Balken aus. Die Breite der Säulen bzw. Balken haben keine Bedeutung bzw. spiegeln keine Werte wider.
Varianten sind das gestapelte und das gruppierte Säulen- bzw. Balkendiagramm. Diese beiden Varianten kommen immer dann zu tragen, wenn die Tabelle mehreren Datenreihen aufweist. Du hast dann zwei verschiedene Möglichkeiten, die Daten in Säulen bzw. Balken umzusetzen:
1. Du ordnest die Datenreihen in Säulen bzw. Balken nebeneinander (gruppiert) an oder
2. Du ordnest die Datenreihen in Säulen bzw. Balken übereinander (gestapelt) an.
Nachfolgend eine Übersicht aller möglichen Varianten von Säulen- bzw. Balkendiagrammen.
Abbildung 5: Varianten von Säulen- und Balkendiagrammen
Anwendungsfälle für das Säulendiagramm
Das Säulendiagramm eignet sich sehr gut, um Schwankungen über einen Zeitraum abzubilden oder einzelne Elemente (Datenreihen) miteinander zu vergleichen (Säulenhöhe), beispielsweise SOLL-IST-Umsatzvergleich.
Um Säulen miteinander visuell unverzerrt vergleichen zu können, ist unbedingt darauf zu achten, dass die Grundlinie der Säulen bei Null beginnt (x-Achse kreuzt y-Achse bei Null).
Bei Säulendiagrammen ist weiters darauf zu achten, dass diese nach einer bestimmten Anzahl von Datenpunkten (>15) unübersichtlich werden. Dann solltest Du besser statt dem Säulendiagramm ein Liniendiagramm wählen.
Ein Säulendiagramm ist immer dann günstiger als ein Liniendiagramm, wenn der Betrachtungszeitraum abgegrenzt ist (z.B. Geschäftsjahr) und Du, wie in Abbildung 6, die aufsummierten Monatswerte pro Jahr vergleichend darstellen willst.
Abbildung 6: Säulendiagramm mit einer Datenreihe
Anwendungsfälle für das Balkendiagramm
Ein Balkendiagramm hat die gleichen Eigenschaften wie ein Säulendiagramm, es ist einfach nur horizontal ausgerichtet.
Für zeitliche Abläufe eignet sich jedoch das Balkendiagramm nicht, da die Balken entlang der y-Achse dargestellt werden. Wenn Du Abbildung 6 noch einmal betrachtest, würde das bedeuten, dass die Jahreszahlen auf der y-Achse abgebildet werden, das wäre sehr verstörend. Also für zeitliche Abläufe immer das Säulendiagramm wählen.
Aber wenn es um den Vergleich von Kategorien geht, wie Firmen, Kunden, Produkte, Niederlassungen usw. dann ist das ein Fall für Balkendiagramme.
Darüber hinaus eignet sich dieser Typ hervorragend, wenn die Kategorienbezeichnungen sehr lange sind, denn links, entlang der y-Achse gibt es ausreichend Platz für die Beschriftung.
Auch für die Darstellung von Rangfolgen, beispielsweise vom Besten zum Schlechtesten, wobei der längste Balken (Beste) ganz oben angeordnet wird, eignen sich Balkendiagramme sehr gut.
Die nachfolgende Grafik verdeutlicht anschaulich, dass das Balkendiagramm für den Vergleich von Kategorien viel besser geeignet ist.
Abbildung 7: Der Kategorienvergleich ist übersichtlicher mit dem Balkendiagramm
Generell gilt folgende Empfehlung:
Für zeitliche Vergleiche wähle das Säulendiagramm, für Vergleiche zwischen verschiedenen Kategorien, wähle das Balkendiagramm.
Gruppierte und gestapelte Varianten von Säulen- und Balkendiagrammen
Immer wenn mehr als eine Datenreihe (zeitlich oder kategorial) gleichzeitig abgebildet werden soll, dann kommen die gruppierten bzw. gestapelten Varianten zum Einsatz.
Gruppiertes Säulen- oder Balkendiagramm
Das nachfolgende Beispiel zeigt den Vergleich der verschiedenen Produkte pro Jahr und über die Jahre. Der Vergleich unter den Produkten in einem bestimmten Jahr ist problemlos möglich, jedoch ein Produkt über die verschiedenen Jahre zu vergleichen ist visuell schwierig.
Abbildung 8: Säulendiagramm mit 4 Datenreihen, verwirrend
Die gruppierte Darstellung bei Säulen- und Balkendiagrammen ist grundsätzlich problematisch bei mehr als 2 Datenreihen (hier die Produkte).
Generelle Empfehlung: Verzichte auf gruppierte Säulen- oder Balkendiagramme bei mehr als 2 Datenreihen und erstelle für jede Datenreihe ein separates Säulen- oder Balkendiagramm. Dadurch ist der Vergleich der einzelnen Produkte über die Jahre viel einfacher. Alternativ könntest Du überlegen, die Daten in gestapelter Form darzustellen, wie im nächsten Abschnitt beschrieben.
Abbildung 9: Säulendiagramm mit 4 Datenreihen, bessere Darstellung als gruppiertes Säulendiagramm
Gestapeltes Säulen- und Balkendiagramm
Wie im letzten Beispiel deutlich wurde, ist die Darstellung von gruppierten Säulen oder Balken bei mehr als 2 Datenreihen problematisch.
Anstatt Säulengruppen nebeneinander abzubilden, ist es besser, Säulen übereinander zu stapeln. Das macht immer dann Sinn, wenn die Summe der Beträge, welche die gestapelten Säulen darstellen, einen sinnvollen Betrag darstellen. So wie in unserem nachfolgenden Beispiel, wo der Umsatz der einzelnen Produkte in Summe den Gesamtumsatz darstellt.
Stapeln eignet sich auch immer dann, wenn die einzelnen Säulen Mengen repräsentieren. Beispielsweise Anzahl Frauen plus Anzahl Männer ergibt Gesamtanzahl an Personen.
Ein typischer Fall für ein gestapeltes Säulendiagramm wäre die Darstellung von mehreren Produkten zum Vergleich über mehrere Jahre, siehe Abbildung 10.
Abbildung 10: Gestapeltes Säulendiagramm mit 5 Datenreihen (Produkte)
Die Zeit wird auf der x-Achse abgebildet, bezeichnet somit den zeitlichen Horizont. Der Umsatz pro Produkt wird auf der y-Achse abgebildet. Jedes Produkt entspricht einem Teilbereich (verschiedene Farben) auf den einzelnen Säulen und widerspiegelt den Umsatz des Produktes.
Die Summe aller Teilbereiche einer Säule entspricht dem Gesamtumsatz pro Jahr. Über den Zeitverlauf lässt sich somit der Gesamtumsatz pro Jahr anhand der Höhe der Säulen vergleichen. Die einzelnen Produkte können ebenfalls anhand ihrer Farbe über die Jahre verglichen werden.
Vielleicht ist Dir schon beim Betrachten von Abbildung 10 aufgefallen, dass der Vergleich der einzelnen Produkte über die Jahre visuell schwer ist.
Abgesehen von der untersten Reihe, wo der Vergleich von Produkt A durch die Grundlinie noch problemlos möglich ist, ist das ab dem Produkt B, rein visuell, nicht mehr so einfach möglich.
Der Grund dafür liegt darin, dass durch die unterschiedlichen Säulenhöhen pro Jahr von Produkt A, das Produkt B über die einzelnen Jahre keine gemeinsame Grundlinie mehr hat. Das erschwert den visuellen Vergleich massiv. Diese ungleiche Grundlinie setzt sich dann für alle weiteren Produkte fort.
Was bedeutet das? Also wenn Dich nur der Vergleich des Gesamtumsatzes pro Jahr (gesamte Säulenhöhe pro Jahr) interessiert, dann ist diese Darstellung in Abbildung 10 gut dafür geeignet. Generell wird empfohlen, nicht mehr als 5 verschiedene Datenreihen in einem gestapelten Säulen- oder Balkendiagramm zu verwenden und nur dann, wenn diese entweder alle im positiven oder im negativen Bereich liegen (Rolf Hichert, IBCS®-Standard).
Möchtest Du aber die einzelnen Produkte über die Jahre vergleichen, dann ist das wegen der fehlenden, gemeinsamen Grundlinie nur schwer möglich.
Um dieses Problem zu lösen, kannst Du – wie bereits bei der gruppierten Variante erwähnt – auch hier, anstatt der gestapelten Säulen ein einfaches Säulendiagramm pro Datenreihe erstellen und diese dann in einer Übersichtstabelle gemeinsam darstellen, siehe nachfolgende Grafik.
Abbildung 11: Produkte in separaten Säulendiagrammen; bessere Darstellung für den einzelnen Produktvergleich
Wenn Du auf das gestapelte Diagramm nicht verzichten möchtest, dann gibt es eine weitere Möglichkeit dieses effektiv darzustellen.
Damit der Vergleich der einzelnen Produkte über die Jahre visuell einfach ist, musst Du für jede Datenreihe eine gemeinsame Grundlinie über die Jahre einfügen. Somit ist zwar der Vergleich des Gesamtumsatzes pro Jahr nicht mehr möglich, dafür aber der Vergleich der einzelnen Produkte.
Hinweis an dieser Stelle: Immer daran denken, was möchtest Du mit Deiner Visualisierung vermitteln. Wie Du ein Diagramm gestaltest, hängt immer von der Story ab, die Du erzählen möchtest. Zuerst die Story, dann die Visualisierung = Grundsatz von Storytelling mit Daten.
In einigen BI-Plattformen wirst Du diese Lösung – mit der gemeinsamen Grundlinie – technisch wahrscheinlich nicht umsetzen können. Da schätze ich wieder einmal die Flexibilität von “Good Old Excel”, es ist zwar etwas tricky, aber problemlos möglich.
Betrachte das nachfolgende Diagramm. Das ist nur ein einziges Diagramm und nicht 5 separate. Ich finde diese Darstellung noch um einiges kompakter und übersichtlicher als die 5 separaten Diagramme, unter anderem, weil nur eine einzige Zeitreihe notwendig ist.
Abbildung 12: Gestapeltes Säulendiagramm mit Grundlinie pro Produkt (Datenreihe), beste Lösung umgesetzt mit Excel
Das gestapelte Säulen- oder Balkendiagramm kann auch als 100%-Variante verwendet werden. Das bedeutet, das die Werte nicht als absolute Werte sondern als relative Prozentsätze angezeigt werden und sich auf 100% Prozent aufsummieren. Diese Darstellung eignet sich sehr gut für die Auswertung von Fragebögen (Likert-Skala).
Abbildung 13: Gestapeltes Balkendiagramm (100% Variante) mit 5 Datenreihen
Die Länge der Balken ist durch die 100%-Variante immer gleich, nur die Teilkategorien weisen unterschiedliche Längen auf und sind ein Anteil des Ganzen. Dadurch lassen sich die Säulen- oder Balken sehr leicht miteinander vergleichen, da links und rechts eine einheitliche Abschlusslinie vorhanden ist.
Das gestapelte 100% Säulen- oder Balkendiagramm ist auch eine gute Alternative zum Kreisdiagramm.
TIPPS für die richtige Anwendung von Säulen- bzw. Balkendiagrammen:
- Geeigneten Abstand zwischen den Säulen bzw. Balken einstellen: Der Spalt zwischen den Säulen/Balken sollte schmaler sein als die Breite der Säulen/Balken. In Excel empfiehlt sich eine Abstandsbreite von 40% bis max. 60%.
- Anordnung: Mach Dir bewusst über die Reihenfolge der Säulen bzw. Balken Gedanken. Wenn es eine natürliche Reihenfolge gibt, beispielsweise Zeitangabe in Jahre oder eine Likert-Skala, dann verwende diese natürliche Rangordnung. Gibt es keine natürliche Reihenfolge, dann ordne die Säulen bzw. Balken nach ihrer Höhe. Entweder vom größten Wert zum kleinsten oder umgekehrt, je nachdem was Du vermitteln willst und zu Deiner Story passt.
- Direkte Datenbeschriftung (Legende): Säulen und Balken bieten sehr viel Platz. Du solltest – statt einer separaten Legende – die Datenreihenbezeichnungen direkt in den Säulen oder Balken unterbringen. Am besten geeignet ist die Position innerhalb der Säulen- oder Balkenenden.
- Grundlinie muss bei NULL beginnen: Beachte unbedingt die Regel, dass Säulen und Balken bei NULL beginnen müssen. Da die Datenwerte in der Länge der Säulen und Balken wiedergegeben werden, muss die gesamte Länge sichtbar sein.
Soviel zu den ersten 4 Diagrammtypen. Im nächsten Artikel nehmen wir die Diagrammtypen Datentabelle (Heatmap, Datenbalken, Sparklines), Streudiagramm, Liniendiagramm und das Steigungsdiagramm genauer unter die Lupe. Sei schon mal gespannt!
FAZIT
Ein Diagramm dient dazu, um die Zusammenhänge von Datentabellen ersichtlich und verständlich zu machen.
Die Wahl des richtigen Diagrammtyps ist dabei entscheidend.
Die meisten Diagrammtypen werden im kartesischen (rechtwinkeligen) Koordinatensystem dargestellt.
Kreis- und Ringdiagramme verwenden das polare Koordinatensystem.
Ein Datenpunkt ist eine einzelne Koordinate (x/y-Wert im kartesischen System). Ein Datenpunkt wird je nach Diagrammtyp durch Balken, Säulen, Linien usw. ersetzt. Die Summe aller Datenpunkte, welche zusammengehören, bilden eine Datenreihe.
Ein Diagramm sollte mindestens folgende Beschriftungselemente aufweisen:
- Diagrammtitel
- Achsenbeschriftung
- Achsentitel
- Legende (wenn möglich Elemente direkt beschriften)
Säulendiagramm
Eigenschaften:
- Säulen sind vertikal an der x-Achse ausgerichtet.
- Wichtig bei der Anwendung: Säulen müssen unbedingt bei 0 beginnen (x-Achse kreuzt y-Achse bei NULL).
Wann verwenden?
- Dieser Typ ist sehr gut geeignet, um Daten über einen abgeschlossenen zeitlichen Horizont zu betrachten (Monat, Quartal, Jahr).
Wann nicht verwenden?
- Bei mehr als 15 Datenpunkten; dann ist das Liniendiagramm besser geeignet.
- Für die Darstellung von nicht zeitlichen Kategorien, wie beispielsweise Produkte. In diesem Fall ist das Balkendiagramm die bessere Wahl.
Balkendiagramm
Eigenschaften:
- Säulen sind horizontal an der y-Achse ausgerichtet
Wann verwenden?
- Für jede Art von Kategorienvergleiche, wie Firmen, Kunden, Produkte, usw.
- Für die Darstellung von Rangfolgen (z.B. Top 10)
- Bei langen Kategorie Bezeichnungen. Die y-Achse bietet ausreichend Platz
Wann nicht verwenden?
- Für zeitliche Abläufe, dafür ist das Säulendiagramm die bessere Wahl.
Merksatz: Für zeitliche Vergleiche nimm das Säulendiagramm, für Vergleiche zwischen Kategorien nimm das Balkendiagramm.
Gruppiertes und gestapeltes Säulen- oder Balkendiagramm
Ist immer dann relevant, wenn es mehr als eine Datenreihe (zeitlich oder kategorial) gibt.
Gruppiertes Säulen- oder Balkendiagramm
Eigenschaften:
- Mehrere Datenreihen werden als Säulen oder Balken gruppiert pro Kategorie dargestellt.
Wann verwenden?
- Bis max. 2 Datenreihen.
Wann nicht verwenden?
- Bei mehr als 2 Datenreihen, dann entweder pro Datenreihe separates Diagramm oder gestapeltes Diagramm mit Grundlinie pro Datenreihe.
Gestapeltes Säulen- oder Balkendiagramm
Eigenschaften:
- Mehrere Datenreihen werden als Säulen oder Balken gestapelt pro Kategorie dargestellt.
Wann verwenden?
- Alternative bei mehr als 2 Datenreihen zum gruppierten Säulen- oder Balkendiagramm.
- Wenn die Summe der einzelnen Beträge, welche die Säulen darstellen, einen Sinn ergibt (Summe Umsatz einzelner Produkte ergibt Gesamtumsatz)
- Wenn die einzelnen Säulen Mengen repräsentieren (Anzahl Frauen + Anzahl Männer = Gesamtanzahl Personen)
Wann nicht verwenden?
- Bei mehr als 5 Datenreihen (einzelne Teilbereiche der Säulen bzw. Balken). Dann ist es besser für jede Datenreihe ein separates Diagramm zu erstellen.
- Wenn Vergleich der einzelnen Teilbereiche (bei Säulen) über die Zeit erfolgen soll. Ausnahme: wenn eine gemeinsame Grundlinie pro Teilbereich geschaffen wird.
Die 100% Variante des gestapelten Balkendiagramms eignet sich besonders für Fragebogenauswertungen (Likert-Skala).