Eine Wahrscheinlichkeitsdichtefunktion (engl. probability density function, PDF) ist eine Funktion, die für jede kontinuierliche Wahrscheinlichkeitsverteilung definiert werden kann. Für eine Zufallsvariable X mit Dichte f(x) gilt: Das Integral der Wahrscheinlichkeitsdichtefunktion im Intervall [ a , b ] {\darstellungsstil [a,b]} {\displaystyle [a,b]}ergibt die Wahrscheinlichkeit, dass die Zufallsvariable X einen Wert in diesem Intervall annimmt:

P(a ≤ X ≤ b) = ∫_a^b f(x) dx.

Wesentliche Eigenschaften

  • Nichtnegativität: f(x) ≥ 0 für alle x.
  • Normierung: Die Fläche unter der Dichte über den gesamten Definitionsbereich ist 1, also ∫_{−∞}^{∞} f(x) dx = 1.
  • Werte der Dichte sind keine Wahrscheinlichkeiten: f(x) selbst ist keine Wahrscheinlichkeit, sondern eine Dichte pro Einheit (z. B. pro Meter, pro Kilogramm). Die Wahrscheinlichkeit für einen einzelnen Punkt P(X = x) ist bei einer echten kontinuierlichen Verteilung null.

Kontinuierlich vs. diskret

Bei diskreten Verteilungen wird die Wahrscheinlichkeit durch eine Wahrscheinlichkeitsfunktion (PMF) auf einzelnen Ausprägungen angegeben. Ein klassisches Beispiel ist das Würfeln: Die Ergebnisse 1 bis 6 haben je die Wahrscheinlichkeit 1 6 {\darstellungsstil {\tfrac {1}{6}}}} {\displaystyle {\tfrac {1}{6}}}. Diese Wahrscheinlichkeiten sind Punktmassen und keine Dichten. Im Gegensatz dazu sind Merkmale wie Körpergröße oder Gewicht praktisch kontinuierlich: zwischen 180 cm und 181 cm liegen unendlich viele mögliche Werte. Mit einer Wahrscheinlichkeitsdichtefunktion kann man dennoch die Wahrscheinlichkeit für solche Intervalle berechnen.

Berechnung von Wahrscheinlichkeiten

Um die Wahrscheinlichkeit zu berechnen, dass X in einem Intervall [a,b] liegt, berechnet man das Integral der Dichte über dieses Intervall:

P(a ≤ X ≤ b) = ∫_a^b f(x) dx.

Die kumulative Verteilungsfunktion (CDF) F(x) ist eng mit der Dichte verbunden:

F(x) = P(X ≤ x) = ∫_{−∞}^x f(t) dt, und sofern f stetig gilt f(x) = F'(x).

Erwartungswert und Varianz

Kenngrößen einer Verteilung lassen sich ebenfalls mit der Dichte ausdrücken:

  • Erwartungswert: E[X] = ∫_{−∞}^{∞} x f(x) dx.
  • Varianz: Var(X) = ∫_{−∞}^{∞} (x − μ)^2 f(x) dx, wobei μ = E[X].

Typische Beispiele

  • Gleichverteilung (uniform): Auf einem Intervall [a,b] ist f(x) = 1/(b−a) für a ≤ x ≤ b und 0 sonst. Die Wahrscheinlichkeit für ein Teilintervall ist proportional zu dessen Länge.
  • Normalverteilung (Gauß): Eine der gebräuchlichsten kontinuierlichen Verteilungen; durch Glockenkurve beschrieben und vollständig durch Mittelwert μ und Standardabweichung σ bestimmt. Die Dichte ist glatt und symmetrisch um μ.

Weitere Hinweise und praktische Aspekte

  • Bei numerischen Berechnungen werden Integrale oft durch Approximation (z. B. numerische Quadratur) oder Monte-Carlo-Simulationen bestimmt.
  • Beim Transformieren von Zufallsvariablen (z. B. Y = g(X)) muss die Dichte entsprechend der Formel für die Veränderung der Variablen angepasst werden (Jacobi-Determinante).
  • In der Statistik werden Dichten aus Daten häufig geschätzt, z. B. mittels Kernel-Dichteschätzern (KDE).
  • Für bedingte Verteilungen gilt analog die bedingte Dichte f(x | y) und für mehrere Variablen die gemeinsame Dichte f(x,y), aus der Randdichten durch Integration gewonnen werden können.

Zusammenfassend liefert die Wahrscheinlichkeitsdichtefunktion eine vollständige Beschreibung einer kontinuierlichen Verteilung: Sie erlaubt das Berechnen von Wahrscheinlichkeiten für Intervalle, das Ermitteln von Erwartungswerten und Varianzen sowie die Analyse und Modellierung realer, kontinuierlicher Messgrößen.