Zufallsvariable

Zufallsvariable

Zufallsvariablen

Zufallsvariablen werden auf den SI-Übungsblättern durch kleine, fettgedruckte Buchstaben gekennzeichnet, z.B. XX.

Diese Notation wird nicht auf den handschriftlichen Mitschrieben umgesetzt, sodass Zufallsvariablen und „normale“ Variablen meistens aus dem Kontext heraus unterschieden werden müssen. 🤪

Eine Zufallsvariable ist eine Art Funktion, die jedem Ergebnis ω\omega deines Zufallsexperiments genau eine Zahl xx zuordnet.

  • ordnet also den Ergebnissen eines Zufallsexperiments reelle Zahlen zu
  • beschreibt sozusagen das Ergebnis eines Zufallsexperiments, das noch nicht durchgeführt wurde

Man sagt Variable, weil deine Zahl, die du am Ende erhältst, eben variabel ist.

‼️Wichtig: zwischen XX und xx zu unterscheiden.

  • XX: die tatsächliche Zufallsvariable, welche keinen festen Wert hat. Sie bildet das derzeit unbekannte Ergebnis eines Zufallsexperiments ab
  • xx: das Ergebnis nach dem Experiment und steht ist somit eine konkrete Zahl.

Bsp: 2 Würfeln werfen

  • Zufallsvariable XX = Augensumme
  • P(X=6)P(X = 6): “Die Wahrscheinlichkeit, dass die Summe von zwei Würfeln sechs ergibt” (Hier x=6x=6)

Diskrete Zufallsvariable

Eine Zufallsvariable wird als diskret bezeichnet, wenn sie nur endlich viele oder abzählbar unendlich viele Werte annimmt.

  • Sklaenarten: Nominal- oder Ordinalskala
„Abzählbar unendlich“ bedeutet, dass die Menge der Ausprägungen durchnummeriert werden kann.

Bsp: Das Ergebnis beim Würfelwurf ist xΩ=1,2,3,4,5,6x \in \Omega = \\{1, 2, 3, 4, 5, 6\\}, also Ω=6|\Omega| = 6.

Wahrscheinlichkeitsfunktion

Bei diskreten Zufallsvariablen ermittelt man die Wahrscheinlichkeitsfunktion (Engl. Probability mass function (PMF)), die Wahrscheinlichkeit für ein ganz konkretes Ergebnis angibt.

f(x):Ω[0,1],xN0 f(x): \Omega \rightarrow[0,1], x \in \mathbb{N}_{0} 截屏2022-05-31 22.20.17

Die Funktionswert

f(x)=P(X=x) f(x) = P(X=x)

entspricht der Wahrscheinlichkeit, dass XX den Wert xx annimmt. Daher gilt

xΩf(x)=1 \sum_{x \in \Omega} f(x)=1

Man schreibt für die „Dichte“ einer diskreten Zufallsvariablen, deren Einzelwahrscheinlichkeiten pn=P(X=xn)p_n = P(X = x_n) gegeben sind, auch

>fX(x)=n=1P(X=xn)δ(xxn)=n=1pnδ(xxn)> > f_{X}(x)=\sum_{n=1}^{\infty} \mathrm{P}\left(X=x_{n}\right) \delta\left(x-x_{n}\right)=\sum_{n=1}^{\infty} p_{n} \delta\left(x-x_{n}\right) >

Verteilungsfunktion

Die Verteilungsfunktion (aka. Kumulative Wahrscheinlichkeitsdichte, Engl,. Cumulative Distribution Function (CDF)) gibt an, mit welcher Wahrscheinlichkeit das Ergebnis des Zufallsexperiments kleiner oder gleich eines bestimmten Wertes ist.

  • Dafür werden alle Ergebnisse bis zu diesem Wert aggregiert, also „aufaddiert“. Deshalb spricht man auch oft von einer kumulativen Verteilungsfunktion.

Um die diskrete Verteilungsfunktion zu erhalten, werden schrittweise alle Wahrscheinlichkeitswerte kumuliert. Das heißt, man bildet das Integral unter der Wahrscheinlichkeitsfunktion.

F(x):Ω[0,1],XN0 F(x): \boldsymbol{\Omega} \rightarrow[\mathbf{0}, \mathbf{1}], X \in \mathbb{N}_{\mathbf{0}} F(x)=P(Xx)=xixf(xi) F(x)= P(X \leq x) = \sum_{x_{i} \leq x} f\left(x_{i}\right) 截屏2022-05-31 22.20.17 截屏2022-05-31 22.43.01

Eigenschaften

  • limxFX(x)=0;limxFX(x)=1\lim _{x \rightarrow-\infty} F_{X}(x)=0 ; \lim _{x \rightarrow \infty} F_{X}(x)=1
  • F(X)F(X) ist monoton steigend und rechtseitig stetig
Beispiel

Würfelwurf:

Wahrscheinlichkeitsfunktion:

f(X=k)=16k1,2,3,4,5,6 f(X=k) = \frac{1}{6} \quad k \in \\{1, 2, 3, 4, 5, 6\\}

Verteilungsfunktion:

F(3)=P(X3)=i3f(X=i)=13+13+13 F(3) = P(X \leq 3) = \sum_{i\leq 3}f(X=i) = \frac{1}{3} + \frac{1}{3} + \frac{1}{3}
In der SI Vorlesung sowie Übung wird die Verteilungsfunktion der Zufallsvariable XX als FX(x)F_{X}(x) schreiben.

Differenz zwischen kumulativer Wahrscheinlichkeiten:

F(b)F(a)=P(a<xb)=P(xb)P(xa) F(b) - F(a) = P(a < x \leq b) = P(x\leq b) - P(x \leq a)

Stetige Zufallsvariable

Eine stetige Zufallsvariable

  • ist überabzählbar, also nimmt unendlich viele, nicht abzählbare Werte an.
  • meistens bei Messvorgängen der Fall (z.B. Zeit, Längen oder Temperatur)
  • Skalenarten: Intervall- oder Rationalskala

Für stetige Zufallsvariable können wir die Wahrscheinlichkeit nur für Intervalle und NICHT für genaue Werte bestimmen.

  • Es gibt doch unendlich viele Werte, also ist es unmöglich, ein exaktes Ergebnis festzulegen.
  • z.B.
    • “Mit welcher Wahrscheinlichkeit ist eine zufällig gewählte Studentin zwischen 165cm und 170cm groß?”
  • Man benutzt im stetigen Fall die Verteilungsfunktion zur Berechnung von Wahrscheinlichkeiten.

Dichtefunktion

Die Dichtefunktion (Engl. Probability Density Function (PDF)) oder Dichte beschreibt, “Wie dicht liegen die betrachteten Werte um einen beliebigen Punkt?”

f(x):ΩR+ f(x): \mathbf{\Omega} \rightarrow \mathbb{R}^{+} 截屏2022-05-31 22.24.46
  • Eigenschaften von ff:
f ist integrierbarf(x)0xR+f(x)dx=1 \begin{array}{l} f \text{ ist integrierbar}\\ f(x) \geq 0 \quad \forall x \in \mathbb{R} \\ \displaystyle \int_{-\infty}^{+\infty} f(x) \mathrm{d} x=1 \end{array}
  • Unterschied zu Wahrscheinlichkeitsfunktion

    • Die Dichtefunktion liefert nicht die Wahrscheinlichkeit, sondern NUR die “Wahrscheinlichkeitsdichte”

    • Bei der stetigen Zufallsvariable, überabzählbar und unendlich viele Ausprägung hat, ist die Wahrscheinlichkeit für jede konkrete Ausprägung gleich 0

      P(X=x)=0xR P(X=x) = 0 \quad \forall x \in \mathbb{R}

Die Wahrscheinlichkeit, dass XX einen Wert x[a,b]x \in [a, b] annimmt , entspricht der Fläsche SS

截屏2022-05-31 22.37.24 P(axb)=abf(x)dx=S P(a \leq x \leq b)=\int_{a}^{b} f(x) \mathrm{d} x=S
In der SI Vorlesung sowie Übung wird die Dichtefunktion der Zufallsvariable XX als fX(x)f_{X}(x) schreiben.

Verteilungsfunktion

F(x):Ω[0,1],xR F(x): \Omega \rightarrow[0,1], x \in \mathbb{R} F(x)=f(x)dx,f(x)=F(x)dx F(x)=\int f(x) \mathrm{d} x, \quad f(x)=\frac{F(x)}{\mathrm{d} x} 截屏2022-05-31 22.24.46 截屏2022-05-31 23.01.08

Die Verteilungsfunktion ist eigentlich die Fläche unter der Dichtfunktion:

F(x)=P(Xx=c)=cf(x)dx F(x)=P(X \leq x=c)=\int_{-\infty}^{c} f(x) \mathrm{d} x 截屏2022-05-31 23.05.33

Die Differenz zwischen zwei Verteilungsfunktion ist also:

F(b)F(a)=P(axb)=abf(x)dx F(b)-F(a)=P(a \leq x \leq b)=\int_{a}^{b} f(x) \mathrm{d} x 截屏2022-05-31 23.07.26

Dichtefunktion vs. Verteilungsfunktion

  • Dichtfunktion beschreibt, wie sind die Wahrscheinlichkeiten konkret verteilt?

  • Verteilungsfunktion

    • Summieren der Wahrscheinlichkeiten \rightarrow Bestimmung der Wahrscheinlichkeit für Intervall
    • liefert die Wahrscheinlichkeit dafür, dass ien Ereignis \leq eines bestimmten Werted eintritt

Diskrete Vs. Stetige Zufallsvariable

Zufalls-
variable
DiskretStetig
BeispielWürfelwurfZeit
Temperatur
Wahrscheinlichkeit
für
bestimmter/konkreter Punkt
P(X=x)[0,1]P(X=x) \in [0, 1]
NUR für Intervall
(P(X=x)=0P(X=x) = 0)
Wahrscheinlichkeitsfunktion/
Dichtefunktion
Wahrscheinlichkeitsfunktion
f(x):Ω[0,1],xN0f(x): \Omega \rightarrow[0,1], x \in \mathbb{N}_{0}
f(x)=P(X=x)f(x) = P(X=x)
xΩf(x)=1\sum_{x \in \Omega} f(x)=1
Dichtefunktion
f(x):ΩR+f(x): \mathbf{\Omega} \rightarrow \mathbb{R}^{+}
ff ist integrierbar
f(x)0xRf(x) \geq 0 \quad \forall x \in \mathbb{R}
+f(x)dx=1\displaystyle \int_{-\infty}^{+\infty} f(x) \mathrm{d} x=1
VerteilungsfunktionF(x):Ω[0,1],XN0F(x): \boldsymbol{\Omega} \rightarrow[\mathbf{0}, \mathbf{1}], X \in \mathbb{N}_{\mathbf{0}}
F(x)=P(Xx)=xixf(xi)F(x)= P(X \leq x) = \sum_{x_{i} \leq x} f\left(x_{i}\right)
F(x):Ω[0,1],xRF(x): \Omega \rightarrow[0,1], x \in \mathbb{R}
F(x)=f(x)dx,f(x)=F(x)dxF(x)=\int f(x) \mathrm{d} x, \quad f(x)=\frac{F(x)}{\mathrm{d} x}
Note: Man schreibt für die *„Dichte“* einer diskreten Zufallsvariablen, deren Einzelwahrscheinlichkeiten pn=P(x=xn)p_n = P(\boldsymbol{x} = x_n) gegeben sind, auch fx(x)=n=1P(x=xn)δ(xxn)=n=1pnδ(xxn), f_{\boldsymbol{x}}(x)=\sum_{n=1}^{\infty} \mathrm{P}\left(\boldsymbol{x}=x_{n}\right) \delta\left(x-x_{n}\right)=\sum_{n=1}^{\infty} p_{n} \delta\left(x-x_{n}\right),

wobei δ()\delta(\cdot) die Delta-Distribution ist. Damit gilt sowohl für kontinuierliche als auch für diskrete Zufallsvariablen der Zusammenhang

ddxFx(x)=fx(x). \frac{d}{d_x} F_{\boldsymbol{x}}(x) = f_{\boldsymbol{x}}(x).

Kenntwerte von Zufallsvariablen

Erwartungswert

Erwartungswert (auch Mittelwert) : der Durchschnitt, wenn ein Versuch unendlich oft durchgeführt wird

EfX{X}=X^=μX=xfX(x)dx E_{f_X}\{X\} = \hat{X} = \mu_{X} = \int_{-\infty}^{\infty} x f_{X}(x) d x
  • Notation: μ\mu, E(X)E(X), E\[X\], EXE\\{X\\}

Rechenregeln

EfX{aX+b}=aEfX{X}+b\mathrm{E}_{f_{X}}\{aX + b\}=a \mathrm{E}_{f_{X}}\{X\}+b
Beweis
E_f_XaX+b=_(ax+b)f_X(x)dx=a_xf_X(x)dx+b_f_X(x)dx=aE_fXX+b1 \begin{array}{ll} &\mathrm{E}\_{f\_{X}}\\{a X+b\\} \\\\ =&\int\_{-\infty}^{\infty}(a x+b) f\_{X}(x) \mathrm{d} x \\\\ =&a \int\_{-\infty}^{\infty} x f\_{X}(x) \mathrm{d} x+b \int\_{-\infty}^{\infty} f\_{X}(x) \mathrm{d} x \\\\ =&a \cdot \mathrm{E}\_{f_{X}}\\{X\\}+b \cdot 1 \end{array}

Mehr Regeln:

Basic expectation rules. (Source: kalmanfilter.net)

Basic expectation rules. (Source: kalmanfilter.net)

kk-te Moment

Der Erwartungswert

EfX{Xk}=xkfX(x)dx \mathrm{E}_{f_X}\left\{X^{k}\right\}=\int_{-\infty}^{\infty} x^{k} f_{X}(x) \mathrm{d} x

ist das kk-te Moment der Zufallsvariable XX.

Der Erwartungswert

EfX{(XE{X})k}=(xμX)kfX(x)dx \mathrm{E}_{f_X}\left\{\left(X-\mathrm{E}\{X\}\right)^{k}\right\}=\int_{-\infty}^{\infty}\left(x-\mu_{X}\right)^{k} f_{X}(x) \mathrm{d} x

ist das kk-te zentrale Moment der Zufallsvariable XX.

Varianz

Varianz := die erwartete quadratische Abweichung vom Erwartungswert

EfX{(XμX)2}=Var(X)=σX2 E_{f_X}\{(X - \mu_X)^2\} = \operatorname{Var}(X) = \sigma_X^2
  • das zweite zentrale Moment

  • Je größer die Varianz, desto weiter streuen die Werte um E(X)E(X)

  • Notationen: σ2\sigma^2, Var(X)\operatorname{Var}(X), \operatorname{Var}\[X\]

Rechenregeln

VarfX{aX+b}=a2VarfX{X}\operatorname{Var}_{f_X}\{aX+b\} = a^2 \operatorname{Var}_{f_X}\{X\}
Beweis
\begin{array}{l} &\operatorname{Var}\_{f\_{X}}\\{a X+b\\} \\\\ =&\mathrm{E}\_{f\_{X}}\left\\{\left(a X+b-\mathrm{E}\_{f\_{X}}\\{a X+b\\}\right)^{2}\right\\} \\\\ =&\mathrm{E}\_{f\_{X}}\left\\{\left(a X+b-\left(a \mu\_{X}+b\right)\right)^{2}\right\\}\\\\ =&\mathrm{E}\_{f\_{X}}\left\\{\left(a\left(X-\mu\_{X}\right)\right)^{2}\right\\} \\\\ =&\int\_{-\infty}^{\infty}\left(a\left(X-\mu\_{X}\right)\right)^{2} f\_{X}(x) \mathrm{d} x \\\\ =&a^{2} \int\_{-\infty}^{\infty}\left(X-\mu\_{X}\right)^{2} f\_{X}(x) \mathrm{d} x \\\\ =&a^{2} \mathrm{E}\_{f\_{X}}\left\\{\left(X-\mu\_{X}\right)^{2}\right\\} \\\\ =&a^{2} \operatorname{Var}\_{f\_{X}}\\{X\\} \end{array}

VarfX{X}=EfX{X2}(EfX{X})2\operatorname{Var}_{f_{X}}\{X\}=\mathrm{E}_{f_{X}}\left\{X^{2}\right\}-\left(\mathrm{E}_{f_{X}}\{X\}\right)^{2}
Beweis
\begin{aligned} \operatorname{Var}\_{f\_{X}}\\\{X\\}=& \int\_{-\infty}^{\infty}\left(x-\mathrm{E}\_{f\_{X}}\\{X\\}\right)^{2} f\_{X}(x) \mathrm{d} x \\\\ =& \int\_{-\infty}^{\infty}\left(x-\mu\_{X}\right)^{2} f\_{X}(x) \mathrm{d} x \\\\ =& \int\_{-\infty}^{\infty}\left(x^{2}-2 x \mu\_{X}+\mu\_{X}^{2}\right) f\_{X}(x) \mathrm{d} x \\\\ =& \int\_{-\infty}^{\infty} x^{2} f\_{X}(x) \mathrm{d} x-2 \mu\_{X} \int\_{-\infty}^{\infty} x f\_{X}(x) \mathrm{d} x+\mu\_{X}^{2} \int\_{-\infty}^{\infty} f\_{X}(x) \mathrm{d} x \\\\ =& \mathrm{E}\_{f\_{X}}\left\\{X^{2}\right\\}-2 \mu\_{X} \mathrm{E}\_{f\_{X}}\\{X\\}+\mu\_{X}^{2} \cdot 1 \\\\ =& \mathrm{E}\_{f\_{X}}\left\\{X^{2}\right\\}-2 \mu\_{X} \mu\_{X}+\mu\_{X}^{2} \cdot 1 \\\\ =& \mathrm{E}\_{f\_{X}}\left\\{X^{2}\right\\}-\mu\_{X}^{2} \end{aligned}

Mehr Regeln:

Basic variance and covariance rules. (Source: kalmanfilter.net)

Basic variance and covariance rules. (Source: kalmanfilter.net)

Beweis für Regel 10
截屏2022-07-04 10.57.26
Beweis für Regel 11
截屏2022-07-04 10.57.54
Beweis für Regel 13
截屏2022-07-04 10.59.10
Beweis für Regel 14
截屏2022-07-04 10.59.30

Standardabweichung

Standardabweichung: Streumaß, das die selbe Einheit wie XX hat

σ=Var(X) \sigma=\sqrt{\operatorname{Var}(X)}

Groß σ\sigma \rightarrow große Streuung

Standard Deviation
Zufalls-
variable
DiskretStetig
Erwartungswert
(μ\mu, E(x)E(x))
iΩxipi\sum_{i \in \Omega} x_{i} \cdot p_{i}+xf(x)dx\int_{-\infty}^{+\infty} x \cdot f(x) \mathrm{d} x
Varianz
(σ2\sigma^2, Var(x)Var(x))
iΩ(xiμ)2pi\sum_{i \in \Omega}\left(x_{i}-\mu\right)^{2} \cdot p_{i}+(xμ)2f(x)dx\int_{-\infty}^{+\infty}(x-\mu)^{2} \cdot f(x) \mathrm{d} x
Standardabweichung
(σ\sigma)
Var(x)\sqrt{Var(x)}Var(x)\sqrt{Var(x)}

Normalverteilte Zufallsvariable

Ein normalverteilte Zufallsvariable XX hat die Dichte

fX(x)=N(xμ,σ2)=12πσe12(xμσ)2 f_{X}(x)=\mathcal{N}\left(x-\mu, \sigma^{2}\right)=\frac{1}{\sqrt{2 \pi} \sigma} e^{-\frac{1}{2}\left(\frac{x-\mu}{\sigma}\right)^{2}}

Ihr kk-tes zentrales Moment ist allgemein

EfX{(Xμ)k}={135(k1)σk falls k gerade 0 falls k ungerade  \mathrm{E}_{f_{X}}\left\{(X-\mu)^{k}\right\}=\left\{\begin{array}{ll} 1 \cdot 3 \cdot 5 \cdots(k-1) \sigma^{k} & \text { falls } k \text { gerade } \\ 0 & \text { falls } k \text { ungerade } \end{array}\right.

Die Normalverteilung ist also vollständig durch μ\mu und σ\sigma charakterisiert.

Standardisierte Zufallsvariable

Eine Zufallsvariable XX mit dem Erwartungswert μX=EfX{X}\mu_X = E_{f_X}\{X\} und der Varianz σX2\sigma_X^2 wird durch

Y=XμXσX Y = \frac{X - \mu_X}{\sigma_X}

in eine standardisierte Zufallsvariable YY, die den Erwartungswert 0 und die Varianz 1 besitzt, transformiert.

Modalwert, Quantil, Median

Ein Wert, für den die Dichtefunktion fX(x)f_X(x) ein lokales Maximum annimmt, heißt Modalwert der stetigen Zufallsvariablen XX.

Ein Wert xpx_p, der den Ungleichungen

P(X<xp)p,P(X>xp)1p(0<p<1) P(X < x_p) \leq p, \quad P(X > x_p) \leq 1 - p \quad (0 < p < 1)

genügt, heißt pp-tes Quantil.

  • Für eine stetige Zufallsvariable X ist ein pp-tes Quantil xpx_p gegeben durch FX(xp)=pF_X(x_p) = p
  • Ein Quantil der Ordnung p=12p=\frac{1}{2} heißt Median der Zufallsvariable XX
  • Für normalverteilte Zufallsvariablen fallen Erwartungswert, Modalwert und Median zusammen.

Reference

  • Wahrscheinlichkeits-, Dichte- und Verteilungsfunktion diskreter und stetiger Zufallsvariablen

  • Erwartungswert

    • Kenngrößen (Momente) von Zufallsvariablen I: Erwartungswert, Varianz, Standardabweichung