Prädiktion nichtlinearer Systeme

Prädiktion nichtlinearer Systeme

Skript 10.2, 10.3

Chapman-Kolmogorov-Gleichung

Übungsblatt Aufg. 10.1

Verbunddichte

f(xk+1,xk)=f(xk+1xk)f(xk) f\left(\underline{x}_{k+1}, \underline{x}_{k}\right)=f\left(\underline{x}_{k+1} \mid \underline{x}_{k}\right) \cdot f\left(\underline{x}_{k}\right)

Marginalisierung

f(xk+1)=RNf(xk+1xk)f(xk)dxk f\left(x_{k+1}\right)=\int_{\mathbb{R}^{N}} f\left(\underline{x}_{k+1} \mid \underline{x}_{k}\right) \cdot f\left(\underline{x}_{k}\right) d \underline{x}_{k}

Definition

  • geschätzte Dichte im Zeitschritt kk einschließlich der letzten Messung

    fke(xk)=f(xky^k,y^k1,,y^1,u^k1,u^k2,,u^0) f_{k}^{e}\left(\underline{x}_{k}\right)=f\left(\underline{x}_{k} \mid \underline{\hat{y}}_{k}, \underline{\hat{y}}_{k-1}, \ldots, \underline{\hat{y}}_{1}, \underline{\hat{u}}_{k-1}, \underline{\hat{u}}_{k-2}, \ldots, \underline{\hat{u}}_{0}\right)
  • Prädiktion der Dichte im Zeitschritt k+1k+1 (Messung nicht inklusive)

    fk+1p(xk+1)=f(xk+1y^k,y^k1,,y^1,u^k,u^k1,,u^0) f_{k+1}^{p}\left(\underline{x}_{k+1}\right)=f\left(\underline{x}_{k+1} \mid \underline{\hat{y}}_{k}, \underline{\hat{y}}_{k-1}, \ldots, \underline{\hat{y}}_{1}, \underline{\hat{u}}_{k}, \underline{\hat{u}}_{k-1}, \ldots, \underline{\hat{u}}_{0}\right)

Prädiktion für dynamische Systeme ( Chapman-Kolmogorov-Gleichung)

fk+1p(xk+1)=RNf(xk+1xk)Pra¨diktionsdichtefke(xk)dxk f_{k+1}^{p}\left(\underline{x}_{k+1}\right)=\int_{\mathbb{R}^{N}} \underbrace{f\left(\underline{x}_{k+1} \mid \underline{x}_{k}\right)}_{\text{Prädiktionsdichte}} f_{k}^{e}\left(\underline{x}_{k}\right) \mathrm{d} \underline{x}_{k}

Erklärung

Üb A10.1

Die Chapman-Kolmogorov-Gleichung berechnet die Dichte von xk+1\underline{x}_{k+1} aus einer gegebenen Dichte fke(xk)f_{k}^{e}\left(\underline{x}_{k}\right) von xk\underline{x}_{k} , während die probabilistische Systembeschreibung f(xk+1xk)f\left(\underline{x}_{k+1} \mid \underline{x}_{k}\right) die Dichte von xk+1\underline{x}_{k+1} für einen konkreten Wert von xk\underline{x}_{k} aus.

截屏2022-08-28 17.02.13
  • f(xk+1xk)f\left(\underline{x}_{k+1} \mid \underline{x}_{k}\right)
    • das probablistische Systemmodell, welches eine Wahrscheinlichkeitsdichte für den nächsten Zustand xk+1\underline{x}_{k+1} zu einem gegebenen aktuellen Zustand xk\underline{x}_{k} ausgibt.

    • Diese Transitionsdichte f(xk+1xk)f\left(\underline{x}_{k+1} \mid \underline{x}_{k}\right) können wir aus dem gegebenen Systemmodell xk+1=a(xk,uk,vk)\underline{x}_{k+1} = \underline{a}(\underline{x}_{k}, \underline{u}_{k}, \underline{v}_{k}) berechnen - es ist einfach die probabilistische Darstellung davon

      f(xk+1xk)=RNδ(xk+1a(xk,uk,vk))fkv(vk)dvk f\left(\underline{x}_{k+1} \mid \underline{x}_{k}\right) = \int_{\mathbb{R}^N} \delta(\underline{x}_{k+1} - \underline{a}(\underline{x}_{k}, \underline{u}_{k}, \underline{v}_{k})) \cdot f_k^v(\underline{v}_k) d \underline{v}_k
  • fke(xk)f_{k}^{e}\left(\underline{x}_{k}\right)

    die beste Schätzung, die wir über den Systemzustand zum Zeitpunkt kk haben, gegeben als Wahrscheinlichkeitsdichte

  • fk+1p(xk+1)f_{k+1}^{p}\left(\underline{x}_{k+1}\right)
    • die beste Prädiktion des Zustands zum Zeitpunkt (k+1)(k+1), die sich aus dem Wissen über den Zustand fke(xk)f_{k}^{e}\left(\underline{x}_{k}\right) und dem Systemmodell xk+1=a(xk,uk,vk)\underline{x}_{k+1} = \underline{a}(\underline{x}_{k}, \underline{u}_{k}, \underline{v}_{k}) (generative Darstellung) bzw. f(xk+1xk)f\left(\underline{x}_{k+1} \mid \underline{x}_{k}\right) (probabilistische Darstellung) berechnen lässt.
    • Bei einer Prädiktion wird die (relative) Unsicherheit generell größer.

Problem

‼️ Es  handelt sich um ein Parameterintegral!

  • Integrand hängt von xk+1\underline{x}_{k+1} ab (lässt sich i.Allg nicht herausziehen)
  • Nur möglich für analytische Lösung
  • Sonst erfordert (numerische) Lösung des Integrals für alle xk+1\underline{x}_{k+1}

Weiter nützliche Form der CK-Gleichung

f(xk+2,xk)=RNf(xk+2,xk+1,xk)dxk+1f(xk+2xk)f(xk)=RNf(xk+2xk+1,xk)f(xk+1,xk)dxk+1Markovf(xk+2xk)f(xk)=RNf(xk+2xk+1)f(xk+1,xk)dxk+1f(xk+2xk)f(xk)=RNf(xk+2xk+1)f(xk+1xk)f(xk)dxk+1f(xk+2xk)=RNf(xk+2xk+1)f(xk+1xk)dxk+1 \begin{aligned} f(\underline{x}_{k + 2}, \underline{x}_{k}) &= \int_{\mathbb{R}^N} f(\underline{x}_{k+2}, \underline{x}_{k+1}, \underline{x}_{k}) d\underline{x}_{k+1} \\\\ f(\underline{x}_{k + 2} \mid \underline{x}_{k}) f(\underline{x}_{k}) &= \int_{\mathbb{R}^N} f(\underline{x}_{k+2} \mid \underline{x}_{k+1}, \underline{x}_{k}) f(\underline{x}_{k+1}, \underline{x}_{k}) d\underline{x}_{k+1} \quad | \quad \text{Markov} \\\\ f(\underline{x}_{k + 2} \mid \underline{x}_{k}) f(\underline{x}_{k}) &= \int_{\mathbb{R}^N} f(\underline{x}_{k+2} \mid \underline{x}_{k+1}) f(\underline{x}_{k+1}, \underline{x}_{k}) d\underline{x}_{k+1} \\\\ f(\underline{x}_{k + 2} \mid \underline{x}_{k}) f(\underline{x}_{k}) &= \int_{\mathbb{R}^N} f(\underline{x}_{k+2} \mid \underline{x}_{k+1}) f(\underline{x}_{k+1} \mid \underline{x}_{k}) f(\underline{x}_{k})d\underline{x}_{k+1} \\\\ f(\underline{x}_{k + 2} \mid \underline{x}_{k}) &= \int_{\mathbb{R}^N} f(\underline{x}_{k+2} \mid \underline{x}_{k+1}) f(\underline{x}_{k+1} \mid \underline{x}_{k}) d\underline{x}_{k+1} \end{aligned} allg_sys-CK_Gleichung.drawio

Prädiktion mit CK-Glg.: Lösungsansätze

Im allgemeinen Fall ist CK-Gleichung NICHT exakt lösbar 🤪

Ausnahme (Bsp.)

  • System ist linear und fke()f_{k}^{e}(\cdot) kann durch erste zwei Momente beschrieben werden

  • fke(xk)f_{k}^{e}(\underline{x}_k) ist durch Abstastwerte repräsentiert.

    fke(xk)=i=1Lwiδ(xkx^k,i)wi0,iwi=1fk=1p(xk+1)=i=1Lwif(xk+1x^k,i) \begin{aligned} & f_{k}^{e}\left(\underline{x}_{k}\right)=\sum_{i=1}^{L} w_{i} \delta\left(\underline{x}_{k}-\hat{\underline{x}}_{k, i}\right) \qquad w_i \geq 0, \sum_i w_i = 1\\ \Rightarrow \qquad & f_{k=1}^{p}\left(\underline{x}_{k+1}\right)=\sum_{i=1}^{L} w_{i} f\left(\underline{x}_{k+1} \mid \hat{\underline{x}}_{k, i}\right) \end{aligned}

Vereinfachte Prädiktion

Systemmodell mit additivem Rauschen

Wir beginnen mit additivem Rauschen.

Generatives Modell

xk+1=ak(xk)+wkxk+1,xk,wkRN \underline{x}_{k+1} = \underline{a}_{k}(\underline{x}_{k}) + \underline{w}_{k} \qquad \underline{x}_{k+1}, \underline{x}_{k}, \underline{w}_{k} \in \mathbb{R}^N

Vereinfachte Schreibweise

z=a(x)+w \underline{z} = \underline{a}(\underline{x}) + \underline{w}

Probablistisches Modell (inkl. Rauschen)

f(zx)=fw(za(x)) f(\underline{z} \mid \underline{x}) = f_w(\underline{z} - \underline{a}(\underline{x}))

Vereinfachung: Aufteilung in diskrete “Streifen”:

f(zx^i)=fw(za(x^i))iZ f\left(\underline{z} \mid \underline{\hat{x}}_{i}\right)=f_w\left(\underline{z}-\underline{a}\left(\underline{\hat{x}}_{i}\right)\right) \qquad i \in \mathbb{Z} 截屏2022-09-13 15.49.14

In den “Zwischenräumen” gilt nun aber f(zx)=1\int f(\underline{z} \mid \underline{x}) = 1 NICHT. Wir definiere eine “Füllfunktion” fi(x)f_i(\underline{x}):

fi(x)=N(x,x^i,Ci)iZ f_i(\underline{x}) = \mathcal{N}(\underline{x}, \underline{\hat{x}}_i, C_i) \qquad i \in \mathbb{Z}

mit

f(x)=iZwifi(x)1 f(\underline{x}) = \sum_{i \in \mathbb{Z}} w_if_i(\underline{x}) \approx 1

Z.B. Skalarer Fall

>f(x)=iZwifi(x),fi(x)=exp(12(xx^i)2σ2)> > f(x)=\sum_{i \in \mathbb{Z}} w_{i} f_i(x), \quad f_i(x)=\exp \left(-\frac{1}{2} \frac{\left(x-\hat{x}_{i}\right)^{2}}{\sigma^{2}}\right) >

mit geeigneten σ\sigma.

Betrachtung für jeweils ein Komponente ii

fi(zx)=f(zx^i)fi(x) f_i(\underline{z} \mid \underline{x}) = f(\underline{z} \mid \underline{\hat{x}}_i) \cdot f_i(\underline{x})

Gesamtdichte ist

f(zx)iZwif(zx^i)fi(x) f(\underline{z} \mid \underline{x}) \approx \sum_{i \in \mathbb{Z}} w_i f(\underline{z} \mid \underline{\hat{x}}_i) \cdot f_i(\underline{x})

Es gilt

RNf(z(x)dz=iZwifi(x)RNf(zx)dz=1=iZwifi(x)1 \begin{aligned} \int_{\mathbb{R}^{N}} f(\underline{z}(\underline{x}) d \underline{z}&=\sum_{i \in \mathbb{Z}} w_{i} f_{i}(\underline{x}) \underbrace{\int_{\mathbb{R}^N}f(\underline{z} \mid \underline{x}) d\underline{z}}_{=1}\\ &=\sum_{i \in \mathbb{Z}} w_{i} f_{i}(\underline{x}) \approx 1 \end{aligned}

Fall Rauschen wk\underline{w}_k Gaußverteilt, ist f(zx)f(\underline{z} \mid \underline{x} ) Gaussian Mixture

f(zx)=iZfiz(z)fw(za(x^i))fix(x) f(\underline{z} \mid \underline{x}) = \sum_{i \in \mathbb{Z}} \underbrace{f_i^z(\underline{z})}_{f_w(\underline{z} - \underline{a}(\underline{\hat{x}}_i))} \cdot f_i^x(\underline{x})

Allgemeine Systemmodelle

xk+1=ak(xk,wk) \underline{x}_{k+1} = \underline{a}_k (\underline{x}_k, \underline{w}_k)

Vereinfachte Schreibweise:

z=a(x,w) \underline{z} = \underline{a}(\underline{x}, \underline{w})

Ergibt allgemeine Transitionsdichte f(zx)f(\underline{z} | \underline{x}), auch durch Mixture approximierbar

f(zx)=iZwifiz(z)fix(x) f(\underline{z} | \underline{x}) = \sum_{i \in \mathbb{Z}} w_i f_i^z(\underline{z}) \cdot f_i^x(\underline{x}) 截屏2022-09-13 16.11.08

Wichtig ist, dass die einzelnen Komponenten entkoppelt sind. 👏

Bsp 1

Annahme: f(x)f(\underline{x}) ist eine Gaußdichte.

Einsetzen in CK-Gleichung:

f(z)=RN(iZwifiz(z)fix(x))f(x)dx=iZwifiz(z)RNfix(x)f(x)dxKonstante ci=iZwici=:wˉifiz(z)=iZwˉifiz(z) \begin{aligned} f(\underline{z})&=\int_{\mathbb{R}^{N}}\left(\sum_{i \in \mathbb{Z}} w_{i} f_{i}^{z}(\underline{z}) \cdot f_{i}^{x}(\underline{x})\right) f(\underline{x}) d \underline{x}\\ &=\sum_{i \in \mathbb{Z}} w_{i} f_{i}^{z}(\underline{z}) \underbrace{\int_{\mathbb{R}^{N}} f_{i}^{x}(\underline{x}) \cdot f(\underline{x}) d \underline{x}}_{\text{Konstante } c_{i}}\\ &= \sum_{i \in \mathbb{Z}} \underbrace{w_{i} c_i}_{=: \bar{w}_i} f_{i}^{z}(\underline{z})\\ &=\sum_{i \in \mathbb{Z}} \bar{w}_{i} f_{i}^{z}(\underline{z}) \end{aligned}

Hier sieht man, dass fiz(z)f_i^z(\underline{z}) einfach aus dem Integral ausgezogen werden kann. Innerhalb des Integrals gibt es nur x\underline{x}.

Speizialfall: f(x)=δ(xx^)f(\underline{x}) = \delta(\underline{x} - \underline{\hat{x}}) \Rightarrow

ci=RNfi(x)δ(xx^)dx=fi(x^) c_i = \int_{\mathbb{R}^{N}} f_{i}(\underline{x}) \delta \left(\underline{x}-\underline{\hat{x}}\right) d \underline{x}=f_i(\underline{\hat{x}})

Bsp 2

Annahme: Gaussian Mixture

f(x)=j=1Lvjfj(x) f(\underline{x}) = \sum_{j=1}^L v_j f_j^*(\underline{x})

Einsetzen in CK-Gleichung:

f(z)=RN{iZwifiz(z)fix(x)}{i=1Lvjfj(x)}dx=iZwifiz(z)i=1LvjRNfix(x)fj(x)dxKonstanteKondante Ci=iπwiCi=:wˉifiz(z)=iπwˉifiz(z) \begin{aligned} f(\underline{z})&=\int_{\mathbb{R}^{N}}\left\{\sum_{i \in \mathbb{Z}} w_{i} f_{i}^{z}(\underline{z}) f_{i}^{x}(\underline{x})\right\} \cdot \left\{\sum_{i=1}^{L} v_{j} f_{j}^{*}(\underline{x})\right\} d x\\ &=\sum_{i \in \mathbb{Z}} w_{i} f_{i}^{z}(\underline{z}) \underbrace{\sum_{i=1}^{L} v_{j} \underbrace{\int_{\mathbb{R}^N} f_{i}^{x}(\underline{x}) \cdot f_{j}^{*}(\underline{x}) d \underline{x}}_{\text{Konstante}}}_{\text {Kondante } C_{i}} \\ &=\sum_{i \in \pi} \underbrace{w_{i}C_i}_{=: \bar{w}_i} f_{i}^{z}(\underline{z}) \\ &=\sum_{i \in \pi} \bar{w}_{i} f_{i}^{z}(\underline{z}) \end{aligned}

截屏2022-09-13 20.55.22