next up previous
Next: Spojitý případ Up: Aproximace metodou nejmenších čtverců Previous: Aproximace metodou nejmenších čtverců

Diskrétní aproximace

Ve statistice je často třeba aproximovat naměřená data, zatížená náhodnými chybami měření nebo náhodným šumem funkční závislostí. Uvedená závislost je nazývána modelem, který je znám až na $M$ neznámých parametrů. V matematické statistice je uvedená úloha nazývána regresí, a k jejímu řešení se často používá metoda nejmenších čtverců. Hlavním cílem statistické analýzy je

  1. vypočítat koeficienty $c_j$, kde $j = 1, \dots, M$
  2. určit směrodatné odchylky koeficientů $\delta c_j$, kde $j = 1, \dots, M$
  3. zjistit kvalitu modelu (zda je použitý model statisticky přijatelný)

Zde chceme nalézt vhodnou aproximaci. Úlohou může být nalezení hladké aproximace bez konstrukce modelu. Jednou z možností je použít zvonové spliny jako bázové funkce.
Nechť je dána síť bodů k krokem $h$. Konstruujeme zvonový spline (bell spline, B-spline) se středem v $\mu$. Označme

\begin{displaymath}
p = h~- \vert x - \mu\vert\ \ , \qquad q = 2h - \vert x - \mu\vert\ \ ,
\end{displaymath}

potom je zvonový spline $B_\mu (x)$ dán vztahy

\begin{displaymath}
B_{\mu} (x) = \left\{ \begin{array}{ll}
0 & q \leq 0 \\
q^3 & p \leq 0 \\
q^3 - 4p^3 & p \geq 0 \end{array}\right.
\end{displaymath}

Zvonový spline je funkce třídy $C^{(2)}$ nenulová pouze v intervalu $\left( \mu - 2h,\mu + 2h \right)$. Hledání koeficientů u zvonových splinů vede na úlohu řešení systému lineárních rovnic s pásovou maticí.


Výpočet parametrů lineární aproximace metodou nejmenších čtverců

  1. Položíme $f(x_i) = \sum_{j=1}^M c_j g_j(x_i)$, kde $M < N$, a získáme tak $N$ rovnic pro $M$ neznámých koeficientů $c_j$. Ve smyslu nejmenších čtverců úlohu řeší SVD metoda.
  2. Funkce $\varrho^2_N$ má minimum, pokud pro $\forall l = 1,\dots,M$ platí

    \begin{displaymath}
\frac{\partial}{\partial c_l} \left[ \sum_{i=1}^N \left( f(x_i) -
\sum_{j=1}^M c_j g_j (x_i) \right)^2 \right] = 0.
\end{displaymath}

    Řešíme pak soustavu $M$ lineárních rovnic o $M$ neznámých $c_j$ nazývanou normální rovnice.

Pozn. Jestliže definujeme skalární součin $(f,g) \equiv \sum_{i=1}^N f(x_i) g(x_i)$, pak lze soustavu normálních rovnic přepsat do tvaru

\begin{displaymath}
\sum_{j=1}^M c_j (g_j, g_l) = (f, g_l).
\end{displaymath}

Výběr bázových (základních) funkcí

  1. Polynomy - jako bázové funkce jsou často voleny $1,
x, x^2, \dots, x^{M-1}$. Tyto základní funkce jsou však vhodné jen pro malá $M$, protože při větších M jsou tyto polynomy přibližně rovnoběžné, soustava normálních rovnic je špatně podmíněná a chyba koeficientů $c_j$ je značná.
  2. Ortogonalizované polynomy - problémy, které vznikají v předchozím případě, zde odpadají. Tyto polynomy konstruujeme Gramm-Schmidtovým ortogonalizačním procesem.
  3. Trigonometrické polynomy - mají základní funkce $1$, $\cos x$, $\sin x$, $\cos 2x$, $\sin 2x$, .... Jsou ortogonální pro všechny body $x_i = \frac{2 \pi i}{2N+1}$, kde $i = 0,1,
\dots, 2N$.


next up previous
Next: Spojitý případ Up: Aproximace metodou nejmenších čtverců Previous: Aproximace metodou nejmenších čtverců
Jiri Limpouch
2000-03-24