Zufallsvariable

Zufallsvariable

Zufallsvariablen

Zufallsvariablen werden auf den SI-Übungsblättern durch kleine, fettgedruckte Buchstaben gekennzeichnet, z.B. $X$.

Diese Notation wird nicht auf den handschriftlichen Mitschrieben umgesetzt, sodass Zufallsvariablen und „normale“ Variablen meistens aus dem Kontext heraus unterschieden werden müssen. 🤪

Eine Zufallsvariable ist eine Art Funktion, die jedem Ergebnis $\omega$ deines Zufallsexperiments genau eine Zahl $x$ zuordnet.

  • ordnet also den Ergebnissen eines Zufallsexperiments reelle Zahlen zu
  • beschreibt sozusagen das Ergebnis eines Zufallsexperiments, das noch nicht durchgeführt wurde

Man sagt Variable, weil deine Zahl, die du am Ende erhältst, eben variabel ist.

‼️Wichtig: zwischen $X$ und $x$ zu unterscheiden.

  • $X$: die tatsächliche Zufallsvariable, welche keinen festen Wert hat. Sie bildet das derzeit unbekannte Ergebnis eines Zufallsexperiments ab
  • $x$: das Ergebnis nach dem Experiment und steht ist somit eine konkrete Zahl.

Bsp: 2 Würfeln werfen

  • Zufallsvariable $X$ = Augensumme
  • $P(X = 6)$: “Die Wahrscheinlichkeit, dass die Summe von zwei Würfeln sechs ergibt” (Hier $x=6$)

Diskrete Zufallsvariable

Eine Zufallsvariable wird als diskret bezeichnet, wenn sie nur endlich viele oder abzählbar unendlich viele Werte annimmt.

  • Sklaenarten: Nominal- oder Ordinalskala
„Abzählbar unendlich“ bedeutet, dass die Menge der Ausprägungen durchnummeriert werden kann.

Bsp: Das Ergebnis beim Würfelwurf ist $x \in \Omega = \\{1, 2, 3, 4, 5, 6\\}$, also $|\Omega| = 6$.

Wahrscheinlichkeitsfunktion

Bei diskreten Zufallsvariablen ermittelt man die Wahrscheinlichkeitsfunktion (Engl. Probability mass function (PMF)), die Wahrscheinlichkeit für ein ganz konkretes Ergebnis angibt.

$$ f(x): \Omega \rightarrow[0,1], x \in \mathbb{N}_{0} $$ 截屏2022-05-31 22.20.17

Die Funktionswert

$$ f(x) = P(X=x) $$

entspricht der Wahrscheinlichkeit, dass $X$ den Wert $x$ annimmt. Daher gilt

$$ \sum_{x \in \Omega} f(x)=1 $$

Man schreibt für die „Dichte“ einer diskreten Zufallsvariablen, deren Einzelwahrscheinlichkeiten $p_n = P(X = x_n)$ gegeben sind, auch

$$ > f_{X}(x)=\sum_{n=1}^{\infty} \mathrm{P}\left(X=x_{n}\right) \delta\left(x-x_{n}\right)=\sum_{n=1}^{\infty} p_{n} \delta\left(x-x_{n}\right) > $$

Verteilungsfunktion

Die Verteilungsfunktion (aka. Kumulative Wahrscheinlichkeitsdichte, Engl,. Cumulative Distribution Function (CDF)) gibt an, mit welcher Wahrscheinlichkeit das Ergebnis des Zufallsexperiments kleiner oder gleich eines bestimmten Wertes ist.

  • Dafür werden alle Ergebnisse bis zu diesem Wert aggregiert, also „aufaddiert“. Deshalb spricht man auch oft von einer kumulativen Verteilungsfunktion.

Um die diskrete Verteilungsfunktion zu erhalten, werden schrittweise alle Wahrscheinlichkeitswerte kumuliert. Das heißt, man bildet das Integral unter der Wahrscheinlichkeitsfunktion.

$$ F(x): \boldsymbol{\Omega} \rightarrow[\mathbf{0}, \mathbf{1}], X \in \mathbb{N}_{\mathbf{0}} $$ $$ F(x)= P(X \leq x) = \sum_{x_{i} \leq x} f\left(x_{i}\right) $$ 截屏2022-05-31 22.20.17 截屏2022-05-31 22.43.01

Eigenschaften

  • $\lim _{x \rightarrow-\infty} F_{X}(x)=0 ; \lim _{x \rightarrow \infty} F_{X}(x)=1$
  • $F(X)$ ist monoton steigend und rechtseitig stetig
Beispiel

Würfelwurf:

Wahrscheinlichkeitsfunktion:

$$ f(X=k) = \frac{1}{6} \quad k \in \\{1, 2, 3, 4, 5, 6\\} $$

Verteilungsfunktion:

$$ F(3) = P(X \leq 3) = \sum_{i\leq 3}f(X=i) = \frac{1}{3} + \frac{1}{3} + \frac{1}{3} $$
In der SI Vorlesung sowie Übung wird die Verteilungsfunktion der Zufallsvariable $X$ als $F_{X}(x)$ schreiben.

Differenz zwischen kumulativer Wahrscheinlichkeiten:

$$ F(b) - F(a) = P(a < x \leq b) = P(x\leq b) - P(x \leq a) $$

Stetige Zufallsvariable

Eine stetige Zufallsvariable

  • ist überabzählbar, also nimmt unendlich viele, nicht abzählbare Werte an.
  • meistens bei Messvorgängen der Fall (z.B. Zeit, Längen oder Temperatur)
  • Skalenarten: Intervall- oder Rationalskala

Für stetige Zufallsvariable können wir die Wahrscheinlichkeit nur für Intervalle und NICHT für genaue Werte bestimmen.

  • Es gibt doch unendlich viele Werte, also ist es unmöglich, ein exaktes Ergebnis festzulegen.
  • z.B.
    • “Mit welcher Wahrscheinlichkeit ist eine zufällig gewählte Studentin zwischen 165cm und 170cm groß?”
  • Man benutzt im stetigen Fall die Verteilungsfunktion zur Berechnung von Wahrscheinlichkeiten.

Dichtefunktion

Die Dichtefunktion (Engl. Probability Density Function (PDF)) oder Dichte beschreibt, “Wie dicht liegen die betrachteten Werte um einen beliebigen Punkt?”

$$ f(x): \mathbf{\Omega} \rightarrow \mathbb{R}^{+} $$ 截屏2022-05-31 22.24.46
  • Eigenschaften von $f$:
$$ \begin{array}{l} f \text{ ist integrierbar}\\ f(x) \geq 0 \quad \forall x \in \mathbb{R} \\ \displaystyle \int_{-\infty}^{+\infty} f(x) \mathrm{d} x=1 \end{array} $$
  • Unterschied zu Wahrscheinlichkeitsfunktion

    • Die Dichtefunktion liefert nicht die Wahrscheinlichkeit, sondern NUR die “Wahrscheinlichkeitsdichte”

    • Bei der stetigen Zufallsvariable, überabzählbar und unendlich viele Ausprägung hat, ist die Wahrscheinlichkeit für jede konkrete Ausprägung gleich 0

      $$ P(X=x) = 0 \quad \forall x \in \mathbb{R} $$

Die Wahrscheinlichkeit, dass $X$ einen Wert $x \in [a, b]$ annimmt , entspricht der Fläsche $S$

截屏2022-05-31 22.37.24 $$ P(a \leq x \leq b)=\int_{a}^{b} f(x) \mathrm{d} x=S $$
In der SI Vorlesung sowie Übung wird die Dichtefunktion der Zufallsvariable $X$ als $f_{X}(x)$ schreiben.

Verteilungsfunktion

$$ F(x): \Omega \rightarrow[0,1], x \in \mathbb{R} $$ $$ F(x)=\int f(x) \mathrm{d} x, \quad f(x)=\frac{F(x)}{\mathrm{d} x} $$ 截屏2022-05-31 22.24.46 截屏2022-05-31 23.01.08

Die Verteilungsfunktion ist eigentlich die Fläche unter der Dichtfunktion:

$$ F(x)=P(X \leq x=c)=\int_{-\infty}^{c} f(x) \mathrm{d} x $$ 截屏2022-05-31 23.05.33

Die Differenz zwischen zwei Verteilungsfunktion ist also:

$$ F(b)-F(a)=P(a \leq x \leq b)=\int_{a}^{b} f(x) \mathrm{d} x $$ 截屏2022-05-31 23.07.26

Dichtefunktion vs. Verteilungsfunktion

  • Dichtfunktion beschreibt, wie sind die Wahrscheinlichkeiten konkret verteilt?

  • Verteilungsfunktion

    • Summieren der Wahrscheinlichkeiten $\rightarrow$ Bestimmung der Wahrscheinlichkeit für Intervall
    • liefert die Wahrscheinlichkeit dafür, dass ien Ereignis $\leq$ eines bestimmten Werted eintritt

Diskrete Vs. Stetige Zufallsvariable

Zufalls-
variable
DiskretStetig
BeispielWürfelwurfZeit
Temperatur
Wahrscheinlichkeit
für
bestimmter/konkreter Punkt
$P(X=x) \in [0, 1]$
NUR für Intervall
($P(X=x) = 0$)
Wahrscheinlichkeitsfunktion/
Dichtefunktion
Wahrscheinlichkeitsfunktion
$f(x): \Omega \rightarrow[0,1], x \in \mathbb{N}_{0}$
$f(x) = P(X=x)$
$\sum_{x \in \Omega} f(x)=1$
Dichtefunktion
$f(x): \mathbf{\Omega} \rightarrow \mathbb{R}^{+}$
$f$ ist integrierbar
$f(x) \geq 0 \quad \forall x \in \mathbb{R}$
$\displaystyle \int_{-\infty}^{+\infty} f(x) \mathrm{d} x=1$
Verteilungsfunktion$F(x): \boldsymbol{\Omega} \rightarrow[\mathbf{0}, \mathbf{1}], X \in \mathbb{N}_{\mathbf{0}}$
$F(x)= P(X \leq x) = \sum_{x_{i} \leq x} f\left(x_{i}\right)$
$F(x): \Omega \rightarrow[0,1], x \in \mathbb{R}$
$F(x)=\int f(x) \mathrm{d} x, \quad f(x)=\frac{F(x)}{\mathrm{d} x}$
Note: Man schreibt für die *„Dichte“* einer diskreten Zufallsvariablen, deren Einzelwahrscheinlichkeiten $p_n = P(\boldsymbol{x} = x_n)$ gegeben sind, auch $$ f_{\boldsymbol{x}}(x)=\sum_{n=1}^{\infty} \mathrm{P}\left(\boldsymbol{x}=x_{n}\right) \delta\left(x-x_{n}\right)=\sum_{n=1}^{\infty} p_{n} \delta\left(x-x_{n}\right), $$

wobei $\delta(\cdot)$ die Delta-Distribution ist. Damit gilt sowohl für kontinuierliche als auch für diskrete Zufallsvariablen der Zusammenhang

$$ \frac{d}{d_x} F_{\boldsymbol{x}}(x) = f_{\boldsymbol{x}}(x). $$

Kenntwerte von Zufallsvariablen

Erwartungswert

Erwartungswert (auch Mittelwert) : der Durchschnitt, wenn ein Versuch unendlich oft durchgeführt wird

$$ E_{f_X}\{X\} = \hat{X} = \mu_{X} = \int_{-\infty}^{\infty} x f_{X}(x) d x $$
  • Notation: $\mu$, $E(X)$, $E\[X\]$, $E\\{X\\}$

Rechenregeln

$\mathrm{E}_{f_{X}}\{aX + b\}=a \mathrm{E}_{f_{X}}\{X\}+b$
Beweis
$$ \begin{array}{ll} &\mathrm{E}\_{f\_{X}}\\{a X+b\\} \\\\ =&\int\_{-\infty}^{\infty}(a x+b) f\_{X}(x) \mathrm{d} x \\\\ =&a \int\_{-\infty}^{\infty} x f\_{X}(x) \mathrm{d} x+b \int\_{-\infty}^{\infty} f\_{X}(x) \mathrm{d} x \\\\ =&a \cdot \mathrm{E}\_{f_{X}}\\{X\\}+b \cdot 1 \end{array} $$

Mehr Regeln:

Basic expectation rules. (Source: kalmanfilter.net)

Basic expectation rules. (Source: kalmanfilter.net)

$k$-te Moment

Der Erwartungswert

$$ \mathrm{E}_{f_X}\left\{X^{k}\right\}=\int_{-\infty}^{\infty} x^{k} f_{X}(x) \mathrm{d} x $$

ist das $k$-te Moment der Zufallsvariable $X$.

Der Erwartungswert

$$ \mathrm{E}_{f_X}\left\{\left(X-\mathrm{E}\{X\}\right)^{k}\right\}=\int_{-\infty}^{\infty}\left(x-\mu_{X}\right)^{k} f_{X}(x) \mathrm{d} x $$

ist das $k$-te zentrale Moment der Zufallsvariable $X$.

Varianz

Varianz := die erwartete quadratische Abweichung vom Erwartungswert

$$ E_{f_X}\{(X - \mu_X)^2\} = \operatorname{Var}(X) = \sigma_X^2 $$
  • das zweite zentrale Moment

  • Je größer die Varianz, desto weiter streuen die Werte um $E(X)$

  • Notationen: $\sigma^2$, $\operatorname{Var}(X)$, $\operatorname{Var}\[X\]$

Rechenregeln

$\operatorname{Var}_{f_X}\{aX+b\} = a^2 \operatorname{Var}_{f_X}\{X\}$
Beweis
$$ \begin{array}{l} &\operatorname{Var}\_{f\_{X}}\\{a X+b\\} \\\\ =&\mathrm{E}\_{f\_{X}}\left\\{\left(a X+b-\mathrm{E}\_{f\_{X}}\\{a X+b\\}\right)^{2}\right\\} \\\\ =&\mathrm{E}\_{f\_{X}}\left\\{\left(a X+b-\left(a \mu\_{X}+b\right)\right)^{2}\right\\}\\\\ =&\mathrm{E}\_{f\_{X}}\left\\{\left(a\left(X-\mu\_{X}\right)\right)^{2}\right\\} \\\\ =&\int\_{-\infty}^{\infty}\left(a\left(X-\mu\_{X}\right)\right)^{2} f\_{X}(x) \mathrm{d} x \\\\ =&a^{2} \int\_{-\infty}^{\infty}\left(X-\mu\_{X}\right)^{2} f\_{X}(x) \mathrm{d} x \\\\ =&a^{2} \mathrm{E}\_{f\_{X}}\left\\{\left(X-\mu\_{X}\right)^{2}\right\\} \\\\ =&a^{2} \operatorname{Var}\_{f\_{X}}\\{X\\} \end{array} $$

$\operatorname{Var}_{f_{X}}\{X\}=\mathrm{E}_{f_{X}}\left\{X^{2}\right\}-\left(\mathrm{E}_{f_{X}}\{X\}\right)^{2}$
Beweis
$$ \begin{aligned} \operatorname{Var}\_{f\_{X}}\\\{X\\}=& \int\_{-\infty}^{\infty}\left(x-\mathrm{E}\_{f\_{X}}\\{X\\}\right)^{2} f\_{X}(x) \mathrm{d} x \\\\ =& \int\_{-\infty}^{\infty}\left(x-\mu\_{X}\right)^{2} f\_{X}(x) \mathrm{d} x \\\\ =& \int\_{-\infty}^{\infty}\left(x^{2}-2 x \mu\_{X}+\mu\_{X}^{2}\right) f\_{X}(x) \mathrm{d} x \\\\ =& \int\_{-\infty}^{\infty} x^{2} f\_{X}(x) \mathrm{d} x-2 \mu\_{X} \int\_{-\infty}^{\infty} x f\_{X}(x) \mathrm{d} x+\mu\_{X}^{2} \int\_{-\infty}^{\infty} f\_{X}(x) \mathrm{d} x \\\\ =& \mathrm{E}\_{f\_{X}}\left\\{X^{2}\right\\}-2 \mu\_{X} \mathrm{E}\_{f\_{X}}\\{X\\}+\mu\_{X}^{2} \cdot 1 \\\\ =& \mathrm{E}\_{f\_{X}}\left\\{X^{2}\right\\}-2 \mu\_{X} \mu\_{X}+\mu\_{X}^{2} \cdot 1 \\\\ =& \mathrm{E}\_{f\_{X}}\left\\{X^{2}\right\\}-\mu\_{X}^{2} \end{aligned} $$

Mehr Regeln:

Basic variance and covariance rules. (Source: kalmanfilter.net)

Basic variance and covariance rules. (Source: kalmanfilter.net)

Beweis für Regel 10
截屏2022-07-04 10.57.26
Beweis für Regel 11
截屏2022-07-04 10.57.54
Beweis für Regel 13
截屏2022-07-04 10.59.10
Beweis für Regel 14
截屏2022-07-04 10.59.30

Standardabweichung

Standardabweichung: Streumaß, das die selbe Einheit wie $X$ hat

$$ \sigma=\sqrt{\operatorname{Var}(X)} $$

Groß $\sigma$ $\rightarrow$ große Streuung

Standard Deviation
Zufalls-
variable
DiskretStetig
Erwartungswert
($\mu$, $E(x)$)
$\sum_{i \in \Omega} x_{i} \cdot p_{i}$$\int_{-\infty}^{+\infty} x \cdot f(x) \mathrm{d} x$
Varianz
($\sigma^2$, $Var(x)$)
$\sum_{i \in \Omega}\left(x_{i}-\mu\right)^{2} \cdot p_{i}$$\int_{-\infty}^{+\infty}(x-\mu)^{2} \cdot f(x) \mathrm{d} x$
Standardabweichung
($\sigma$)
$\sqrt{Var(x)}$$\sqrt{Var(x)}$

Normalverteilte Zufallsvariable

Ein normalverteilte Zufallsvariable $X$ hat die Dichte

$$ f_{X}(x)=\mathcal{N}\left(x-\mu, \sigma^{2}\right)=\frac{1}{\sqrt{2 \pi} \sigma} e^{-\frac{1}{2}\left(\frac{x-\mu}{\sigma}\right)^{2}} $$

Ihr $k$-tes zentrales Moment ist allgemein

$$ \mathrm{E}_{f_{X}}\left\{(X-\mu)^{k}\right\}=\left\{\begin{array}{ll} 1 \cdot 3 \cdot 5 \cdots(k-1) \sigma^{k} & \text { falls } k \text { gerade } \\ 0 & \text { falls } k \text { ungerade } \end{array}\right. $$

Die Normalverteilung ist also vollständig durch $\mu$ und $\sigma$ charakterisiert.

Standardisierte Zufallsvariable

Eine Zufallsvariable $X$ mit dem Erwartungswert $\mu_X = E_{f_X}\{X\}$ und der Varianz $\sigma_X^2$ wird durch

$$ Y = \frac{X - \mu_X}{\sigma_X} $$

in eine standardisierte Zufallsvariable $Y$, die den Erwartungswert 0 und die Varianz 1 besitzt, transformiert.

Modalwert, Quantil, Median

Ein Wert, für den die Dichtefunktion $f_X(x)$ ein lokales Maximum annimmt, heißt Modalwert der stetigen Zufallsvariablen $X$.

Ein Wert $x_p$, der den Ungleichungen

$$ P(X < x_p) \leq p, \quad P(X > x_p) \leq 1 - p \quad (0 < p < 1) $$

genügt, heißt $p$-tes Quantil.

  • Für eine stetige Zufallsvariable X ist ein $p$-tes Quantil $x_p$ gegeben durch $F_X(x_p) = p$
  • Ein Quantil der Ordnung $p=\frac{1}{2}$ heißt Median der Zufallsvariable $X$
  • Für normalverteilte Zufallsvariablen fallen Erwartungswert, Modalwert und Median zusammen.

Reference

  • Wahrscheinlichkeits-, Dichte- und Verteilungsfunktion diskreter und stetiger Zufallsvariablen

  • Erwartungswert

    • Kenngrößen (Momente) von Zufallsvariablen I: Erwartungswert, Varianz, Standardabweichung