Gleichmäßige und normale Häufigkeitsverteilungen

Es gibt zwei typische Häufigkeitsverteilungen, die uns auch in der Praxis häufig begegnen können. Dies sind die gleichmäßige Häufigkeitsverteilung und die normale Häufigkeitsverteilung.

Gleichmäßige Häufigkeitsverteilung

Eine gleichmäßige Verteilung bedeutet, dass alle Werte in unserer Grundgesamtheit gleich häufig vorkommen. Wir können zum Beispiel zählen, wie viele Monate die Jahre 2000, 2001, ..., 2009 hatten:

Wenn wir einen klassischen idealisierten Würfel werfen, haben wir die Wahrscheinlichkeit $\frac16$, eine 1 zu würfeln, die Wahrscheinlichkeit $\frac16$, eine 2 zu würfeln, und so weiter. Wir sprechen also von einer gleichmäßigen Wahrscheinlichkeitsverteilung, weil jedes Ergebnis die gleiche Wahrscheinlichkeit hat.

Eine ungleichmäßige Verteilung wäre, wenn wir einen klirrenden Würfel hätten, bei dem die Wahrscheinlichkeit $\frac13$ immer eine Sechs wäre. Die anderen Seiten können nicht auch die Wahrscheinlichkeit $\frac13$ haben. Ähnlich könnte man die Anzahl der Tage in jedem Monat zählen - nicht alle Monate haben die gleiche Anzahl von Tagen, also wäre es keine gleichmäßige Häufigkeitsverteilung.

Normale Wahrscheinlichkeitsverteilung

Eine Normalverteilung wird manchmal auch als Gaußsche Verteilung bezeichnet. Sie wird nur für kontinuierliche Zufallsvariablen verwendet. Eine standardisierte Normalverteilung hat die folgende Form:

Standardisierte normale Wahrscheinlichkeitsverteilung

Diese Kurve wird durch eine so genannte Gaußsche Funktion beschrieben, die die Form hat:

$$ \Large f(x) = \frac{1}{\sigma\sqrt{2\pi}} \mathrm{e}^{-\frac{{(x-\mu)}^2}{2\sigma^2}} $$

Die Funktion ist ziemlich kompliziert, man muss sie sich nicht merken. Aber wir sehen, dass wir die Normalverteilung mit dem Mittelwert und der Standardabweichung parametrisieren können. Wir können dann verschiedene Diagramme für verschiedene Werte von Mittelwert und Varianz erhalten:

Verschiedene Normalverteilungen

Die Normalverteilung ist wichtig, weil sie die verschiedenen Verteilungen, die uns im wirklichen Leben begegnen können, ziemlich getreu simuliert. Wir können sehen, dass die Kurve immer ein globales Maximum hat, das auch gleich dem Mittelwert ist. Die rote Kurve hat zum Beispiel ein Maximum bei X = 0, so dass der Mittelwert dieser Größe gleich Null ist. Die Kurve ist symmetrisch, sie ist achsensymmetrisch mit einer Linie, die senkrecht zur Achse X verläuft und durch den Mittelwert, den Punkt X = 0, geht. Mit anderen Worten - die Kurve sieht links von Null genauso aus wie rechts von Null. Die grüne Kurve hat die gleichen Eigenschaften, allerdings mit dem Punkt X = −2 bei Null.

Die Normalverteilung kann die Verteilung der Intelligenz oder des IQ unter den Menschen treffend beschreiben. Der durchschnittliche IQ beträgt - per Definition - 100. Dabei gibt es ungefähr gleich viele Menschen mit einem IQ über 100 und unter 100. Es gibt ungefähr genauso viele leicht unterdurchschnittlich intelligente Menschen wie leicht überdurchschnittlich intelligente Menschen, und es gibt genauso viele Idioten wie Genies. Auch wenn es manchmal nicht so aussieht :-). Ein Diagramm, das die ungefähre Verteilung des IQ zeigt:

IQ-Verteilung

Bei einer Normalverteilung spielt die Standardabweichung eine große Rolle. Wenn wir eine Normalverteilung mit einer Standardabweichung von $\sigma$ haben, dann müssen 68 % der Werte im Intervall $\left<\mu-\sigma, \mu+\sigma\right>$ liegen. Das heißt, 68 % der Werte weichen um höchstens eine Standardabweichung vom Mittelwert ab. Ungefähr 95 % der Werte müssen dann im Intervall $\left<\mu-2\sigma, \mu+2\sigma\right>$ und 99,7 % der Werte im Intervall $\left<\mu-3\sigma, \mu+3\sigma\right>$ liegen. Dies wird in der folgenden Abbildung deutlich dargestellt:

Normalverteilung und Standardabweichung

Referenzen und Quellen