Allgemeine Systeme

Allgemeine Systeme

Generatives und probabilistisches Modell

Für Herleitung ist es super wichtig, die Eigenschaft der Dirac’schen Funktion anzuwenden:

δ(g(x))=i=1N1g(xi)δ(xxi) \delta (g(x)) = \sum_{i=1}^N \frac{1}{|g^\prime(x_i)|}\delta (x - x_i)
  • g(xi)=0g(x_i) = 0
  • g(xi)0g^\prime(x_i) \neq 0

Mit Additivem Rauschen

Generatives Modell:

z=a(x)+vvfv(v) z = a(x) + v \quad v \sim f_v(v)

Probabilistisches Modell:

f(zx)=fv(za(x)) f(z \mid x) = f_v(z - a(x))

Mit Multiplikativem Rauschen

Generatives Modell:

z=xvvfv(v) z = x \cdot v \quad v \sim f_v(v)

Probabilistisches Modell:

f(zx)=1xfv(zx) f(z \mid x) = \frac{1}{|x|}f_v(\frac{z}{x})

Warum lässt sich das nur bei bestimmten Modellen exakt lösen?

“For the general generative model, where the noise enters the system in an arbitrary fashion.” (Script P149)

Abstraktion

截屏2022-08-27 10.48.03

Prädiktion (Vorwärtsinferenz)

Üb9 A2, A3
  • Gegeben
    • fa(a)f_a(a)
    • g(a)g(a)
  • Gesucht: fb(b)f_b(b)
allg_sys-Vorwaertsinferenz.drawio

Chapman-Kolmogorov-Gleichung

Üb A10.1
fk+1p(xk+1)=RNf(xk+1xk)Pra¨diktionsdichtefke(xk)dxk f_{k+1}^{p}\left(\underline{x}_{k+1}\right)=\int_{\mathbb{R}^{N}} \underbrace{f\left(\underline{x}_{k+1} \mid \underline{x}_{k}\right)}_{\text{Prädiktionsdichte}} f_{k}^{e}\left(\underline{x}_{k}\right) \mathrm{d} \underline{x}_{k}

Herleitung ist ganz simple: Verbunddichte + Marginalisierung

f(xk+1)=RNf(xk+1,xk)dxk=RNf(xk+1xk)f(xk)dxk f\left(x_{k+1}\right)= \int_{\mathbb{R}^{N}} f\left(\underline{x}_{k+1}, \underline{x}_{k}\right) d \underline{x}_{k}= \int_{\mathbb{R}^{N}} f\left(\underline{x}_{k+1} \mid \underline{x}_{k}\right) \cdot f\left(\underline{x}_{k}\right) d \underline{x}_{k}

‼️ Problem: Parameterintegral

  • Integrand hängt von xk+1\underline{x}_{k+1} ab (lässt sich i.Allg nicht herausziehen)
  • Erfordert Lösung des Integrals für alle xk+1\underline{x}_{k+1}
  • Nur möglich für analytische Lösung

Prädiktionsschritte

  1. Umforme f(ba)=δ(bg(a))f(b \mid a) = \delta(b - g(a)) mit

    δ(g(x))=i=1N1g(xi)δ(xxi) \delta (g(x)) = \sum_{i=1}^N \frac{1}{|g^\prime(x_i)|}\delta (x - x_i)

    wobei

    • g(xi)=0g(x_i) = 0 (also xix_i sind Nullstellen, i=1,2,,Ni = 1, 2, \dots, N)
    • g(xi)0g^\prime(x_i) \neq 0
  2. Berechne fb(b)f_b(b) mithilfe von Chapman-Kolmogorov-Gleichung

    f(b)=f(ba)f(a)da f(b) = \int f(b \mid a) f(a) da

    und setze die Unformung von f(ba)f(b \mid a) von Schritt 1 ein. Dann kriege die gesuchte Dichtefunktion fb(b)f_b(b) in Abhängigkeit von fa(a)f_a(a).

Vereinfachte Prädiktion

Für

z=a(x,w) \underline{z} = \underline{a}(\underline{x}, \underline{w})

ist die Transitionsdichte f(zx)f(\underline{z} | \underline{x}) durch Mixture approximierbar

f(zx)=iZfiz(z)fix(x) f(\underline{z} | \underline{x}) = \sum_{i \in \mathbb{Z}} f_i^z(\underline{z}) \cdot f_i^x(\underline{x})

wobei fiz(z)f_i^z(\underline{z}) und fix(x)f_i^x(\underline{x}) beliebige Dichte (z.B Gaußdichte) sein können.

Schreibweise mit xk+1\underline{x}_{k+1} und xk\underline{x}_{k} :

f(xk+1xk)=i=1Lwk(i)fk+1(i)(xk+1)fk(i)(xk) f\left(\underline{x}_{k+1} \mid \underline{x}_k\right)=\sum_{i=1}^L w_k^{(i)} f_{k+1}^{(i)}\left(\underline{x}_{k+1}\right) f_k^{(i)}\left(\underline{x}_k\right)

Filterung

Rückwartsinferenz

allg_sys-Rueckwaertsinferenz.drawio

Bei Rückwartsinferenz ist es wichtig, Formel von Bayes anwuwenden.

f(ab)=f(a,b)f(b)=f(ba)f(a)f(b)=1f(b)Normalizationskonstantf(ba)Likelihoodf(a)Vorwissen f(a \mid b) = \frac{f(a, b)}{f(b)} = \frac{f(b \mid a) f(a)}{f(b)} = \underbrace{\frac{1}{f(b)}}_{\text{Normalizationskonstant}} \cdot \underbrace{f(b \mid a)}_{\text{Likelihood}} \cdot \underbrace{f(a)}_{\text{Vorwissen}}

Konkrete Messung

Üb9 A2, A3
  1. Umforme fb(ba)=δ(bg(a))f_b(b \mid a) = \delta(b - g(a)) mit

    δ(g(x))=i=1N1g(xi)δ(xxi) \delta (g(x)) = \sum_{i=1}^N \frac{1}{|g^\prime(x_i)|}\delta (x - x_i)

    wobei

    • g(xi)=0g(x_i) = 0 (also xix_i sind Nullstellen, i=1,2,,Ni = 1, 2, \dots, N)
    • g(xi)0g^\prime(x_i) \neq 0
  2. Berechne fb(b)f_b(b)

    fb(b)=fa,b(a,b)da=fb(ba)fa(a)da f_b(b) = \int f_{a, b}(a, b) da = \int f_{b}(b \mid a) f_a(a) da

    mit Einsetzen der Unformung von f(ba)f(b \mid a) von Schritt 1 ein

  3. Berechne fa(ab^)f_a(a \mid \hat{b}) mithilfe von Bayes Regeln

    fa(ab^)=fa(b^a)fa(a)fb(b^)=δ(b^g(a))Schritt 1fa(a)fb(b^)Schritt 2 f_a(a \mid \hat{b}) = \frac{f_a(\hat{b} \mid a) f_a(a)}{f_b(\hat{b})} = \frac{\overbrace{\delta(\hat{b} - g(a))}^{\text{Schritt 1}} f_a(a)}{\underbrace{f_b(\hat{b})}_{\text{Schritt 2}}}

Unsichere Messung

Üb A9.4
allg_sys-Rueckwaertsinferenz_dichte.drawio

Schritte:

  1. Erweitere das System um eine zusätzliche stochastische Abbildung und einen festen Ausgang z^\hat{z}
截屏2022-08-08 16.51.24
  1. Bestimme f(z^y)f(\hat{z} \mid y)

    f(z^y)=f(yz^)f(z^)f(y)=f(yz^)f(z^)f(y,x)dx=f(yz^)f(z^)f(yx)f(x)dx=f(yz^)f(z^)δ(yg(x))f(x)dx \begin{aligned} f(\hat{z} \mid y) &= \frac{f(y \mid \hat{z})f(\hat{z})}{f(y)} \\\\ &= \frac{f(y \mid \hat{z})f(\hat{z})}{\int f(y, x) dx} \\\\ &= \frac{f(y \mid \hat{z})f(\hat{z})}{\int f(y|x)f(x) dx} \\\\ &= \frac{f(y \mid \hat{z})f(\hat{z})}{\int \delta(y - g(x)) f(x) dx} \\\\ \end{aligned}

    Und setze die Umformung von δ(yg(x))\delta(y - g(x))

    δ(g(x))=i=1N1g(xi)δ(xxi) \delta (g(x)) = \sum_{i=1}^N \frac{1}{|g^\prime(x_i)|}\delta (x - x_i)
    • g(xi)=0g(x_i) = 0 (also xix_i sind Nullstellen, i=1,2,,Ni = 1, 2, \dots, N)
    • g(xi)0g^\prime(x_i) \neq 0

    ein.

  2. Berechung der Rückwärtsinferenz f(xz^)f(x \mid \hat{z})

    f(xz^)=1f(z^)f(x,z^)Marginalisierung nach y=1f(z^)f(x,y,z^)dy=1f(z^)f(z^y,x)f(y,x)dyz^,x sind unabha¨ngig=1f(z^)f(z^y)f(yx)f(x)dy=1f(z^)f(z^y)Berechnet in Schritt 1f(yx)Systemmodellf(x)dy \begin{aligned} f(x \mid \hat{z}) &=\frac{1}{f\left(\hat{z}\right)} \cdot f(x, \hat{z}) \quad \mid \text{Marginalisierung nach } y\\ &=\frac{1}{f(\hat{z})} \int f(x, y, \hat{z}) d y \\ &=\frac{1}{f(\hat{z})} \int f(\hat{z} \mid y, x) \cdot f(y , x) d y \quad \mid \hat{z}, x \text{ sind unabhängig}\\ &=\frac{1}{f(\hat{z})} \int f(\hat{z} \mid y) \cdot f(y \mid x) \cdot f(x) d y \\ &=\frac{1}{f(\hat{z})} \int \underbrace{f(\hat{z} \mid y)}_{\text{Berechnet in Schritt 1}} \cdot \underbrace{f(y \mid x)}_{\text{Systemmodell}} \cdot f(x) d y \end{aligned}

Schwierigkeit vom Filterschritt

  1. Type der Dichte zur Beschreibung der Schätzung ändert sich
  2. Dichte wrid mit jedem Schritt komplexer

Vereinfachte Filterung

Vereinfachung der Likelihood f(yx)f(\underline{y} \mid \underline{x}) durch Mixture (Analog zu vereinfachter Prädiktion)

f(yx)=iZfiy(y)fix(x) f(\underline{y} \mid \underline{x}) = \sum_{i \in \mathbb{Z}} f_i^y(\underline{y}) f_i^x(\underline{x})