Histogramm einfach erklärt: Definition, Aufbau & Beispiele

Histogramm einfach erklärt: Definition, Aufbau & anschauliche Beispiele zu Verteilungen in der Statistik – leicht verständlich, mit Praxis-Tipps und Grafiken.

Autor: Leandro Alegsa

Ein Histogramm ist ein Begriff aus der Statistik. Es ist eine grafische Darstellung, die über die Verteilung der beteiligten Stichproben Auskunft gibt. Häufig handelt es sich dabei um ein Bild aus nebeneinanderstehenden Säulen (Balken), das aus einer Tabelle mit vielen Kategorien erstellt wurde. Die Tabelle gibt an, wie viele Stichproben es in jeder Kategorie gibt — diese Häufigkeiten werden dann in der Höhe der Säulen sichtbar.

Das Wort Histogramm ist von histos und gramma im Griechischen abgeleitet. Histos bedeutet Netz oder Mast. Gramma bedeutet Zeichnung, Aufzeichnung oder Schrift. Ein Histogramm von etwas ist also, etymologisch gesprochen, eine Zeichnung des Netzes dieses Etwas.

Aufbau eines Histogramms

Ein Histogramm besteht aus folgenden Grundelementen:

  • Klassen (Bins): Intervalle, in die der Wertebereich eingeteilt wird (z. B. 0–10, 10–20, ...).
  • Säulen: Für jede Klasse steht eine Säule. Die Höhe zeigt die Häufigkeit oder relative Häufigkeit der Werte in dieser Klasse.
  • Achsen: Die horizontale Achse zeigt die Klassen (Wertebereiche), die vertikale Achse die Häufigkeit oder Dichte.
  • Skalierung: Histogramme können absolute Häufigkeit, relative Häufigkeit (Prozent) oder Dichte (zur Flächen-Normierung) darstellen.

Wichtig: Klassenbreite und -anzahl

Die Wahl der Klassenbreite beeinflusst das Aussehen und die Interpretation deutlich:

  • Zu wenige, zu breite Klassen glätten die Verteilung und können Details verschleiern.
  • Zu viele, zu schmale Klassen führen zu sehr unruhigen Histogrammen und können Zufallsschwankungen überbetonen.

Bekannte Regeln zur Wahl der Klassenanzahl sind z. B. Sturges, Scott oder Freedman–Diaconis. Moderne Software bietet meist automatische Auswahlmöglichkeiten, die man aber immer kritisch prüfen sollte.

Häufigkeit, relative Häufigkeit und Dichte

Ein Histogramm kann verschiedene Informationen kodieren:

  • Absolute Häufigkeit: Anzahl der Beobachtungen pro Klasse (z. B. 12 Personen im Intervall 170–175 cm).
  • Relative Häufigkeit: Anteil an der Gesamtzahl (z. B. 12 von 200 = 6 %).
  • Dichte: Wenn man die Flächen der Säulen normiert, ergibt sich eine Dichte, die bei Vergleich unterschiedlicher Stichprobengrößen oder ungleicher Klassenbreiten hilfreich ist. Die Fläche jeder Säule entspricht dann der Wahrscheinlichkeit, in die jeweilige Klasse zu fallen.

Wie liest man ein Histogramm?

  • Die Form der Verteilung zeigt zentrale Tendenz: Lage (z. B. Mittelwert, Median) liegt dort, wo die Säulen hoch sind.
  • Die Breite der Verteilung gibt die Streuung an: Breite Verteilungen bedeuten große Variation.
  • Schiefe (links-/rechtssteil): Asymmetrien weisen auf Schiefe der Verteilung hin (z. B. rechtssteile Verteilungen bei Einkommensdaten).
  • Modalität: Ein- oder mehrgipflig (unimodal, bimodal usw.) — mehrere Gipfel können Subgruppen anzeigen.
  • Ausreißer: Einzelne weit abgesetzte Säulen oder Lücken können auf Ausreißer hinweisen.

Beispiele

  • Größenverteilung einer Schulklasse: Klassenbreite 5 cm; jede Säule zeigt, wie viele Schüler in ein Größenintervall fallen.
  • Punktzahlen einer Prüfung: Ein Histogramm zeigt, ob die Noten konzentriert, gestreut oder zweigipflig sind (z. B. wegen unterschiedlicher Vorbereitung).
  • Tägliche Niederschlagsmengen in einem Monat: Viele Tage mit 0 mm, einige mit kleiner Menge und wenige mit hohen Werten — häufig rechtssteile Verteilung.

Anwendungsbeispiele und Tools

Histogramme werden in vielen Bereichen genutzt: Qualitätskontrolle, Finanzdaten (Renditen), Meteorologie, Medizin (z. B. Laborwerte), Soziologie und Marktforschung. Für die Erstellung stehen gängige Programme und Bibliotheken zur Verfügung:

  • Excel: „Histogramm“-Tool oder Häufigkeitsverteilung mit Balkendiagramm.
  • Python: matplotlib.pyplot.hist, seaborn.histplot oder displot.
  • R: hist(), ggplot2::geom_histogram().

Worauf man achten sollte (Limitierungen)

  • Histogramme sind abhängig von der Wahl der Klassen: falsche Wahl kann zu Fehlschlüssen führen.
  • Bei kleinen Stichproben sind Histogramme oft wenig aussagekräftig; glatte Dichteschätzungen (z. B. Kernel-Density) können ergänzend nützlich sein.
  • Vergleiche zwischen Gruppen: Wenn die Gruppen unterschiedliche Stichprobengrößen oder unterschiedliche Klassenbreiten haben, sollte man relative Häufigkeiten oder Dichten vergleichen, nicht absolute Häufigkeiten.

Varianten

  • Kumulatives Histogramm: Summiert die Häufigkeiten bis zu jedem Klassenende; entspricht der empirischen Verteilungsfunktion (empirical CDF).
  • Dichteplots / Kernel-Density-Estimates: Glattere Schätzungen der Verteilung, die Histogramme ergänzen oder ersetzen können.

Kurz zusammengefasst

Ein Histogramm ist eine einfache, visuelle Methode, um die Verteilung von Daten zu zeigen. Es macht Häufigkeiten in Klassen sichtbar und hilft, Lage, Streuung, Schiefe, Modalität und Ausreißer zu erkennen. Die Qualität der Aussage hängt stark von der Wahl der Klassenbreite und der Stichprobengröße ab — sorgfältige Einstellungen und ergänzende Visualisierungen verbessern die Interpretation.

Beispiel eines Histogramms von 100 normalverteilten ZufallswertenZoom
Beispiel eines Histogramms von 100 normalverteilten Zufallswerten

Ähnliche Ideen

Das Histogramm ist eines der sieben grundlegenden Instrumente der Qualitätskontrolle, zu denen auch das Pareto-Diagramm, das Kontrollblatt, die Kontrollkarte, das Ursache-Wirkungs-Diagramm, das Flussdiagramm und das Streudiagramm gehören.

Eine Verallgemeinerung des Histogramms sind Kernel-Glättungstechniken. Dabei wird aus den gelieferten Daten eine glatte Wahrscheinlichkeitsdichtefunktion konstruiert.

Fragen und Antworten

F: Was ist ein Histogramm?


A: Ein Histogramm ist eine grafische Darstellung, die Aufschluss über die Verteilung der betreffenden Stichproben gibt.

F: Was ist der Zweck eines Histogramms?


A: Der Zweck eines Histogramms besteht darin, die Verteilung der beteiligten Stichproben darzustellen.

F: Was bedeutet das Wort Histogramm?


A: Das Wort Histogramm leitet sich vom griechischen Wort histos und gramma ab. Histos bedeutet Netz oder Mast. Gramma bedeutet Zeichnung, Aufzeichnung oder Schrift.

F: Was bedeutet der Begriff "histos" im Griechischen?


A: Der Begriff "histos" bedeutet im Griechischen "Netz" oder "Mast".

F: Was bedeutet der Begriff "gramma" auf Griechisch?


A: Der Begriff "gramma" bedeutet auf Griechisch Zeichnung, Aufzeichnung oder Schrift.

F: Was ist ein gemeinsames Merkmal eines Histogramms?


A: Ein gemeinsames Merkmal eines Histogramms ist ein Bild, das aus einer Tabelle mit vielen Kategorien erstellt wird.

F: Welche Informationen liefert eine Histogrammtabelle?


A: Eine Histogrammtabelle gibt Auskunft darüber, wie viele Stichproben es in jeder Kategorie gibt.


Suche in der Enzyklopädie
AlegsaOnline.com - 2020 / 2025 - License CC3