Teorie aproximace
V matematice , teorie aproximace týká toho, jak funkce lze aproximovat pomocí jednodušších funkcí , dávat kvantitativní charakterizaci těchto chyb zavedených těchto aproximací.
Problematický
Problém aproximace vznikl velmi brzy v geometrii u trigonometrických funkcí : jedná se o funkce, jejichž vlastnosti známe (parita, derivovatelnost, hodnoty v konkrétních bodech), ale které nejsou vyjádřeny z d ' operací, které lze provádět ručně ( čtyři operace ). To vedlo ke konceptu sériového vývoje . Byli jsme tedy schopni vytvořit trigonometrické tabulky , pak s podobným přístupem logaritmické tabulky a obecně tabulky pro funkce běžně používané ve vědě, jako je druhá odmocnina .
Obzvláště zajímavým problémem je aproximace funkcí jinými definovanými pouze ze základních počítačových operací , jako je sčítání a násobení, aby se vytvořily knihovny matematických funkcí, které zase produkují hodnoty, které se co nejvíce blíží teoretickým hodnotám . Toto se nazývá polynomiální nebo racionální aproximace (tj. Racionálními funkcemi ).
Cílem je poskytnout co přesné přiblížení jak je to možné z dané reálné funkce, tak, aby poskytovaly co nejpřesnější možné hodnoty, k přesnému blízko k pohyblivou řádovou čárkou aritmetiky jednoho počítače . Tohoto cíle je dosaženo použitím polynomu vysokého stupně a / nebo zmenšením domény, nad kterou musí polynom aproximovat funkci. Redukci domény lze často provést, i když to vyžaduje složení dalších afinních funkcí , aby byla funkce aproximována. Moderní matematické knihovny často zmenšují doménu rozdělením na několik malých segmentů a na každém segmentu používají polynom nízkého stupně.
Jakmile je vybrána doména a stupeň polynomu, je zvolen samotný polynom, aby se minimalizovala chyba v nejhorším případě. Jinými slovy, je-li f skutečná funkce a P polynom, který se musí přiblížit f , musíme minimalizovat horní mez funkce v doméně. Pro "vhodnou" funkci je optimální polynom stupně N charakterizován chybovou křivkou, jejíž hodnota osciluje mezi + ε a - ε a která mění znaménko N + 1krát, což znamená chybu v nejhorších případech ε . Je možné sestrojit funkce f, pro které tato vlastnost neplatí, ale v praxi je to obecně pravda.
|P-F|{\ displaystyle | Pf |}![{\ displaystyle | Pf |}](https://wikimedia.org/api/rest_v1/media/math/render/svg/eae6f7f379327f04a5782935484c62999afb3314)
-
Chyba mezi optimálním polynomem stupně 4 a přirozeným logaritmem ln (červeně) a mezi Čebyševovou aproximací ln (modře) v intervalu [2, 4]. Vertikální krok je 10 −5 . Maximální chyba pro optimální polynom je 6,07 × 10 −5 .
-
Chyba mezi optimálním polynomem stupně 4 a exponenciálním e (červeně) a mezi Čebyševovou aproximací a exp (modře) v intervalu [-1,1]. Vertikální krok je 10 −4 . Maximální chyba pro optimální polynom je 5,47 × 10 −4 .
V každém případě je počet extrémů N + 2, tj. 6. Dva extrémy jsou konce segmentu. Křivky červené, pro optimální polynom, jsou „rovné“, to znamená, že přesně oscilují mezi + ε a - ε . Pokud polynom stupně N vede k chybové funkci, která osciluje mezi extrémy N + 2krát, pak je tento polynom optimální.
Aproximace polynomy
Státy
Nechť f je spojitá funkce v uzavřeném reálném intervalu [ a , b ] . Nechť P je polynom stupně n .
Zaznamenáváme chybu aproximace mezi P a f .
ε=P-F{\ displaystyle \ varepsilon = Pf}![{\ displaystyle \ varepsilon = Pf}](https://wikimedia.org/api/rest_v1/media/math/render/svg/45c3cd750ce55aa71a2890e160ddb97d13b02484)
Pokud existuje a tak
na≤X0<X1<⋯<Xne+1≤b{\ displaystyle a \ leq x_ {0} <x_ {1} <\ cdots <x_ {n + 1} \ leq b}
s∈{-1,1}{\ displaystyle s \ in \ {- 1, \; 1 \}}![{\ displaystyle s \ in \ {- 1, \; 1 \}}](https://wikimedia.org/api/rest_v1/media/math/render/svg/6c6000f7d0b8e4c6cdd810da59ac44f4975a9f38)
∀i∈{0,...,ne+1},ε(Xi)=(-1)is‖P-F‖∞{\ displaystyle \ forall i \ in \ {0, \ ldots, n + 1 \}, \ varepsilon (x_ {i}) = (- 1) ^ {i} s \ | Pf \ | _ {\ infty}}![{\ displaystyle \ forall i \ in \ {0, \ ldots, n + 1 \}, \ varepsilon (x_ {i}) = (- 1) ^ {i} s \ | Pf \ | _ {\ infty}}](https://wikimedia.org/api/rest_v1/media/math/render/svg/4781fbec374508033acc7af29b87fce3aced21c8)
,
pak P je optimální aproximační polynom f z polynomů stupně menšího nebo rovného n ve smyslu sup normy na [ a , b ] :
P=argminQ∈Rne[X]‖F-S‖∞,[na,b]{\ displaystyle P = \ operatorname {arg} \ min _ {Q \ in \ mathbb {R} _ {n} [X]} \ | fS \ | _ {\ infty, [a, b]}}![{\ displaystyle P = \ operatorname {arg} \ min _ {Q \ in \ mathbb {R} _ {n} [X]} \ | fS \ | _ {\ infty, [a, b]}}](https://wikimedia.org/api/rest_v1/media/math/render/svg/fc42108601969b42cc9327f4a365fbe96c1dd20a)
Demonstrace
Začněme tím, že to ukážeme v grafu. Pojďme pózovat . Předpokládejme, že jde o polynom stupně, který má výše uvedené vlastnosti v tom smyslu, že osciluje mezi extrémy střídavých znaků, od do .
NE=4{\ displaystyle N = 4}
P{\ displaystyle P}
ne{\ displaystyle n}
P-F{\ displaystyle Pf}
ne+2{\ displaystyle n + 2}
+ε{\ displaystyle + \ varepsilon}
-ε{\ displaystyle - \ varepsilon}![{\ displaystyle - \ varepsilon}](https://wikimedia.org/api/rest_v1/media/math/render/svg/6a07b913c3b445bab7efbcbf683b09d53b625674)
Chybová funkce může vypadat jako červený graf:
P-F{\ displaystyle Pf}
P-F{\ displaystyle Pf}
dosáhl extrémů (z nichž dva jsou na končetinách), které mají stejnou velikost v absolutní hodnotě umístěné v 6 intervalech na grafu výše.
ne+2{\ displaystyle n + 2}![n + 2](https://wikimedia.org/api/rest_v1/media/math/render/svg/aaf4207e44c00a9312fe3e8710efbefcd6eafdc0)
Nechť je nyní aproximační polynom optimálního stupně . To znamená, že extrémy její chybové funkce musí mít absolutní hodnotu striktně menší než , aby byly umístěny striktně uvnitř grafu chyby pro .
Q{\ displaystyle Q}
ne{\ displaystyle n}
ε{\ displaystyle \ varepsilon}
P{\ displaystyle P}![P](https://wikimedia.org/api/rest_v1/media/math/render/svg/b4dc73bf40314945ff376bd363916a738548d40a)
Chybová funkce pro může mít grafické znázornění připomínající modrý graf výše. To znamená, že musí oscilovat mezi přísně kladnými a přísně zápornými nenulovými čísly celkem . Ale rovná se, což je polynom stupně . Musí mít alespoň kořeny umístěné mezi různými body, ve kterých polynomiální funkce přebírá nenulové hodnoty. V integrálním kruhu však nenulový polynom stupně nemůže mít více kořenů. Totéž je tedy identicky nula, to znamená .
Q{\ displaystyle Q}
(P-F)-(Q-F){\ displaystyle (Pf) - (Qf)}
NE+2{\ displaystyle N + 2}
(P-F)-(Q-F){\ displaystyle (Pf) - (Qf)}
P-Q{\ displaystyle PQ}
ne{\ displaystyle n}
ne+1{\ displaystyle n + 1}
ne{\ displaystyle n}
ne{\ displaystyle n}
P-Q{\ displaystyle PQ}
P=Q{\ displaystyle P = Q}![P = Q](https://wikimedia.org/api/rest_v1/media/math/render/svg/2abc7e2c5a78e9e6cb7a2a907279953f9b4a3f52)
Čebyševova aproximace
Je možné získat polynomy velmi blízké optimálnímu polynomu rozšířením dané funkce o Čebyševovy polynomy a následným snížením expanze do určité míry. Tento proces je podobný rozšíření Fourierovy řady funkcí ve Fourierově analýze , ale místo obvyklých trigonometrických funkcí používá Čebyševovy polynomy .
Vypočítáme koeficienty v Čebyševově expanzi funkce f :
F(X)≃∑ne=0∞vs.neTne(X){\ displaystyle f (x) \ simeq \ sum _ {n = 0} ^ {\ infty} c_ {n} T_ {n} (x)}![{\ displaystyle f (x) \ simeq \ sum _ {n = 0} ^ {\ infty} c_ {n} T_ {n} (x)}](https://wikimedia.org/api/rest_v1/media/math/render/svg/1ff3e92ae8eebd81f1f4e9b54ab08039cc1e38d5)
z nichž ponecháme pouze prvních N členů řady, což dává polynom stupně N blížící se funkci f .
Důvod, proč je tento polynom téměř optimální, je ten, že u funkcí připouštějících expanzi v celočíselných řadách, jejichž řada má rychlou konvergenci, je chyba způsobená expanzí po N termínech přibližně stejná jako termín bezprostředně následující za řezem. To znamená, že první člen těsně po řezu dominuje součtu všech následujících termínů nazývaných zbytek série. Tento výsledek zůstává, pokud je expanze provedena pomocí Čebyševových polynomů. Pokud je Čebyševova expanze přerušena po T N , pak bude chyba blízká termínu v T N + 1 . Čebyševovy polynomy mají tu vlastnost, že mají reprezentativní křivku „na úrovni“, která osciluje mezi +1 a -1 v intervalu [-1,1]. T n + 1 a n + 2 extrémy . To znamená, že chyba mezi f a jeho Čebyševovou aproximací k členu v T n je funkce mající n + 2 extrémy, jejichž maxima (respektive minima) jsou stejná, a je tedy blízká optimálnímu polynomu stupně n .
V grafických příkladech výše vidíme, že chybová funkce zobrazená modře je někdy lepší (pokud zůstane níže) než funkce zobrazená červeně, ale v určitých intervalech horší, což znamená, že to není zcela optimální polynom. Tento rozdíl je relativně méně důležitý pro exponenciální funkci , jejíž celá řada konverguje velmi rychle, než pro logaritmickou funkci .
Čebyševovy systémy
Tato část a následující vycházejí hlavně z děl Cheneyho a Powella.
Je možné zobecnit charakterizaci „nejlepší aproximace“ s prostory aproximačních funkcí, které nejsou polynomy, ale standardními funkcemi. Takové rodiny funkcí však musí mít určité dobré vlastnosti, které polynomy mají. Mluvíme pak o „zobecněných polynomech“. Tyto „polynomy“ budou mít základní funkce (které považujeme za příjemné) jako monomily, které splňují Haarovy podmínky.
Haarovy podmínky
Rodina funkcí intervalu v splňuje Haarovy podmínky tehdy a jen tehdy
{G1,...,Gne}{\ displaystyle \ {g_ {1}, \ tečky, g_ {n} \}}
[na,b]{\ displaystyle [a, b]}
R{\ displaystyle \ mathbb {R}}![\ mathbb {R}](https://wikimedia.org/api/rest_v1/media/math/render/svg/786849c765da7a84dbc3cce43e96aad58a5868dc)
- Všechny funkce jsou spojité.Gi{\ displaystyle g_ {i}}
![g_ {i}](https://wikimedia.org/api/rest_v1/media/math/render/svg/2ce36142a0a1c6660e82bdf3ef3f1551317efe0c)
- Funkce splňují následující ekvivalentní podmínky:
G1,...,Gne{\ displaystyle g_ {1}, \ tečky, g_ {n}}
![{\ displaystyle g_ {1}, \ tečky, g_ {n}}](https://wikimedia.org/api/rest_v1/media/math/render/svg/1ab736e4d81fa410e1a1f5971ce627bf1aa00a92)
- Pro všechny odlišnéX1,...,Xne∈[na,b]{\ displaystyle x_ {1}, \ tečky, x_ {n} \ v [a, b]}
|G1(X1)⋯Gne(X1)⋮⋮G1(Xne)⋯Gne(Xne)|≠0{\ displaystyle \ left | {\ begin {matrix} g_ {1} (x_ {1}) & \ cdots & g_ {n} (x_ {1}) \\\ vdots && \ vdots \\ g_ {1} ( x_ {n}) & \ cdots & g_ {n} (x_ {n}) \ end {matrix}} \ right | \ neq 0}
- Pro všechny odlišné, pro všechny existuje jedinečná n-tice , která funkci splňujeX1,...,Xne∈[na,b]{\ displaystyle x_ {1}, \ tečky, x_ {n} \ v [a, b]}
y1,...,yne{\ displaystyle y_ {1}, \ tečky, y_ {n}}
(α1,...,αne){\ displaystyle (\ alpha _ {1}, \ tečky, \ alpha _ {n})}
F=∑i=1neαiGi{\ displaystyle f = \ sum _ {i = 1} ^ {n} \ alpha _ {i} g_ {i}}
∀i∈{1,...,ne}F(Xi)=yi{\ displaystyle \ forall i \ in \ {1, \ tečky, n \} \ quad f (x_ {i}) = y_ {i}}
- Funkce jsou lineárně nezávislé a je to jedinečná funkce formy, která má přísně více kořenůG1,...,Gne{\ displaystyle g_ {1}, \ tečky, g_ {n}}
X↦0{\ displaystyle x \ mapsto 0}
X↦∑i=1neαiGi(X){\ displaystyle x \ mapsto \ sum _ {i = 1} ^ {n} \ alpha _ {i} g_ {i} (x)}
ne-1{\ displaystyle n-1}
[na,b]{\ displaystyle [a, b]}
Konečná rodina funkcí vyhovujících Haarovým podmínkám se nazývá Čebyševův systém. Je zřejmé, že monomály se zmenšeným stupněm tvoří Čebyševův systém: polynomy jsou spojité, podmínka 2.1 je determinant Vandermonde , podmínka 2.2 je charakterizace interpolačního polynomu a podmínka 2.3 je skutečnost, že polynom stálého stupně nemůže mít více kořenů než jeho stupeň.
G1,...,Gne∈VS([na,b]){\ displaystyle g_ {1}, \ tečky, g_ {n} \ v {\ mathcal {C}} ([a, b])}
{1,X,...Xne-1}{\ displaystyle \ {1, X, \ tečky X ^ {n-1} \}}![{\ displaystyle \ {1, X, \ tečky X ^ {n-1} \}}](https://wikimedia.org/api/rest_v1/media/math/render/svg/8be6570edb815c68a66785f3a737b68fbc79a67d)
Můžeme také říci, subprostorový z kót splňuje podmínky Haar tehdy a jen tehdy, pokud jeho základy jsou Čebyševovy systémy.
E{\ displaystyle E}
VS([na,b]){\ displaystyle {\ mathcal {C}} ([a, b])}
ne{\ displaystyle n}![ne](https://wikimedia.org/api/rest_v1/media/math/render/svg/a601995d55609f2d9f5e233e36fbe9ea26011b3b)
Rovnocennost charakterizací
Důkaz rovnocennosti bodů 2.1, 2.2 a 2.3 bude proveden kruhovými implikacemi.
2,1 ⇒ 2,2 Zvažte odlišné a . Hypotézou 2.1 si všimneme zejména toho, že matice
X1,...,Xne∈[na,b]{\ displaystyle x_ {1}, \ tečky, x_ {n} \ v [a, b]}
y1,...,yne∈R{\ displaystyle y_ {1}, \ tečky, y_ {n} \ in \ mathbb {R}}![{\ displaystyle y_ {1}, \ tečky, y_ {n} \ in \ mathbb {R}}](https://wikimedia.org/api/rest_v1/media/math/render/svg/987951f450fcecfef40652d0baddaa6a096adea9)
M: =(G1(X1)⋯Gne(X1)⋮⋮G1(Xne)⋯Gne(Xne)){\ displaystyle M: = \ left ({\ begin {matrix} g_ {1} (x_ {1}) & \ cdots & g_ {n} (x_ {1}) \\\ vdots && \ vdots \\ g_ {1} (x_ {n}) & \ cdots & g_ {n} (x_ {n}) \ end {matrix}} \ right)}![{\ displaystyle M: = \ left ({\ begin {matrix} g_ {1} (x_ {1}) & \ cdots & g_ {n} (x_ {1}) \\\ vdots && \ vdots \\ g_ {1} (x_ {n}) & \ cdots & g_ {n} (x_ {n}) \ end {matrix}} \ right)}](https://wikimedia.org/api/rest_v1/media/math/render/svg/f5f7f3989807646e8e6e3a09d7ee3964f0813286)
7
je invertibilní. Existuje tedy jedinečné řešení rovnice Nebo tato poslední rovnice odpovídá . Přijde tedy existence a jedinečnost n-tice tak, že interpoluje y i v x i .
M⋅(na1,...,nane)T=(y1,...,yne)T{\ displaystyle M \ cdot (a_ {1}, \ tečky, a_ {n}) ^ {T} = (y_ {1}, \ tečky, y_ {n}) ^ {T}}
∀i∈{1,...,ne}∑j=1nenajGj(Xi)=yi{\ displaystyle \ forall i \ in \ {1, \ dots, n \} \ quad \ sum _ {j = 1} ^ {n} a_ {j} g_ {j} (x_ {i}) = y_ {i }}
(α1,...,αne){\ displaystyle (\ alpha _ {1}, \ tečky, \ alpha _ {n})}
F=∑i=1neαiGi{\ displaystyle f = \ sum _ {i = 1} ^ {n} \ alpha _ {i} g_ {i}}![{\ displaystyle f = \ sum _ {i = 1} ^ {n} \ alpha _ {i} g_ {i}}](https://wikimedia.org/api/rest_v1/media/math/render/svg/65e18345a73ddc9a025d4d3bd84941672c8b028c)
2.2 ⇒ 2.3 Nulová funkce má jasně striktně více než n - 1 kořenů mezi a a b , protože je má nekonečno. Pojďme nyní mít n odlišných kořenů, jak je uvedeno . Funkce null a f se v těchto bodech shodují. Vlastností 2.2 tedy máme f = 0 . Z toho dále vyplývá, že g i jsou lineárně nezávislé, pokud by neexistovalo dvojí psaní funkce null, což předpoklad 2.2 zakazuje.
X↦0{\ displaystyle x \ mapsto 0}
F=∑i=1neαiGi{\ displaystyle f = \ sum _ {i = 1} ^ {n} \ alpha _ {i} g_ {i}}
X1,...,Xne{\ displaystyle x_ {1}, \ dots, x_ {n}}![x_ {1}, \ tečky, x_ {n}](https://wikimedia.org/api/rest_v1/media/math/render/svg/e5afdbc2d248d8fa9ba2c4f5188d946a0537e753)
2,3 ⇒ 2,1 Nechte se odlišit. Předpokládejme, že matice není invertibilní. Pak jsou jeho sloupce lineárně závislé, a proto existuje takový . Pak jsou kořeny, které jsou tedy nulové vlastností 2.3. Vždy se touto vlastností, vyplývá podle nezávislost g i , že což je absurdní. Matice je tedy invertibilní a její determinant je proto nenulový.
X1,...,Xne∈[na,b]{\ displaystyle x_ {1}, \ tečky, x_ {n} \ v [a, b]}
M: =(G1(X1)⋯Gne(X1)⋮⋮G1(Xne)⋯Gne(Xne)){\ displaystyle M: = \ left ({\ begin {matrix} g_ {1} (x_ {1}) & \ cdots & g_ {n} (x_ {1}) \\\ vdots && \ vdots \\ g_ {1} (x_ {n}) & \ cdots & g_ {n} (x_ {n}) \ end {matrix}} \ right)}
α1,...,αne{\ displaystyle \ alpha _ {1}, \ tečky, \ alpha _ {n}}
∀j∈{1,...,ne}∑i=1neαiGi(Xj)=0{\ displaystyle \ forall j \ in \ {1, \ dots, n \} \ quad \ sum _ {i = 1} ^ {n} \ alpha _ {i} g_ {i} (x_ {j}) = 0 }
X1,...,Xne{\ displaystyle x_ {1}, \ dots, x_ {n}}
∑i=1neαiGi{\ displaystyle \ sum _ {i = 1} ^ {n} \ alpha _ {i} g_ {i}}
∀i∈{1,...,ne}αi=0{\ displaystyle \ forall i \ in \ {1, \ dots, n \} \ quad \ alpha _ {i} = 0}![{\ displaystyle \ forall i \ in \ {1, \ dots, n \} \ quad \ alpha _ {i} = 0}](https://wikimedia.org/api/rest_v1/media/math/render/svg/285b1e00f03be959709fcba306b9e86af3674788)
Příklady
Můžeme uvést dva příklady Čebyševových systémů:
- Pokud jsou dva na dva odlišné, pak tvoří systém Čebyšev na libovolném kompaktním intervalu .λ1,...,λne{\ displaystyle \ lambda _ {1}, \ tečky, \ lambda _ {n}}
{Eλ1X,...,EλneX}{\ displaystyle \ {\ mathrm {e} ^ {\ lambda _ {1} x}, \ tečky, \ mathrm {e} ^ {\ lambda _ {n} x} \}}
R{\ displaystyle \ mathbb {R}}![\ mathbb {R}](https://wikimedia.org/api/rest_v1/media/math/render/svg/786849c765da7a84dbc3cce43e96aad58a5868dc)
- Pokud jsou dva na dva odlišné a pozitivní, pak tvoří systém Čebyšev zapnutý pro kompaktní interval .λ1,...,λne{\ displaystyle \ lambda _ {1}, \ tečky, \ lambda _ {n}}
{Xλ1,...,Xλne}{\ displaystyle \ {x ^ {\ lambda _ {1}}, \ tečky, x ^ {\ lambda _ {n}} \}}
R{\ displaystyle \ mathbb {R}}![\ mathbb {R}](https://wikimedia.org/api/rest_v1/media/math/render/svg/786849c765da7a84dbc3cce43e96aad58a5868dc)
Alternační věta
Čebyševovy systémy umožňují charakterizovat nejlepší aproximace spojitých funkcí jako zobecněné polynomy sestavené z funkcí zmíněného systému.
Státy
Zvažte systém Čebyšev. Nechť je spojitá funkce. Dovolit být zobecněný polynom nad Čebyševovým systémem a aproximační chyba. Pak je nejlepší jednotný aproximace , která je , právě tehdy, když existuje taková, že i{G1,...,Gne}⊆VS([na,b]){\ displaystyle \ {g_ {1}, \ tečky, g_ {n} \} \ subseteq {\ mathcal {C}} ([a, b])}
F∈VS([na,b]){\ displaystyle f \ in {\ mathcal {C}} ([a, b])}
p∗=∑i=1neαi∗Gi{\ displaystyle p ^ {*} = \ součet _ {i = 1} ^ {n} \ alpha _ {i} ^ {*} g_ {i}}
r∗=F-p∗{\ displaystyle r ^ {*} = fp ^ {*}}
p∗{\ displaystyle p ^ {*}}
F{\ displaystyle f}
‖r∗‖∞=minp∈Vect(G1,...,Gne)‖F-p‖∞{\ displaystyle \ | r ^ {*} \ | _ {\ infty} = \ min _ {p \ in {\ textrm {Vect}} (g_ {1}, \ dots, g_ {n})} {\ | fp \ | _ {\ infty}}}
na≤X0<⋯<Xne≤b{\ displaystyle a \ leq x_ {0} <\ cdots <x_ {n} \ leq b}
r(Xi)=(-1)ir(X0){\ displaystyle r (x_ {i}) = (- 1) ^ {i} r (x_ {0})}
r(X0)=±‖r‖∞{\ displaystyle r (x_ {0}) = \ pm \ | r \ | _ {\ infty}}
Poznámka
Je zajímavé si povšimnout, že pokud uvažovaný Čebyševův systém je kanonickým základem, pak je toto tvrzení přesně takové jako věta v případě polynomů.
Rne-1[X]{\ displaystyle \ mathbb {R} _ {n-1} [X]}![{\ displaystyle \ mathbb {R} _ {n-1} [X]}](https://wikimedia.org/api/rest_v1/media/math/render/svg/f34bef053af381b12aa110b822c6f7b187d6894c)
Důkaz alternační věty
Věta o charakterizaci
První věcí, kterou musíte udělat, je charakterizovat nejlepší aproximace pomocí zobecněných polynomů. Můžeme začít tím, že ukážeme, že stačí, aby počátek prostoru byl v určité konvexní obálce. U systému Čebyšev si povšimneme .
{G1,...,Gne}{\ displaystyle \ {g_ {1}, \ tečky, g_ {n} \}}
X^=(G1(X),...,Gne(X))T{\ displaystyle {\ hat {x}} = (g_ {1} (x), \ tečky, g_ {n} (x)) ^ {T}}![{\ displaystyle {\ hat {x}} = (g_ {1} (x), \ tečky, g_ {n} (x)) ^ {T}}](https://wikimedia.org/api/rest_v1/media/math/render/svg/a6af355843c5b4faaaca4d5d1c56ba8258eb3395)
Zvažte systém Čebyšev. Nechť je spojitá funkce. Dovolit být zobecněný polynom nad Čebyševovým systémem a aproximační chyba. Pak r je minimální normy právě tehdy, když 0 je v konvexním trupu .{G1,...,Gne}⊆VS([na,b]){\ displaystyle \ {g_ {1}, \ tečky, g_ {n} \} \ subseteq {\ mathcal {C}} ([a, b])}
F∈VS([na,b]){\ displaystyle f \ in {\ mathcal {C}} ([a, b])}
p=∑i=1neαi∗Gi{\ displaystyle p = \ sum _ {i = 1} ^ {n} \ alpha _ {i} ^ {*} g_ {i}}
r=F-p{\ displaystyle r = fp}
{r(X)X^ | r(X)=‖r‖∞}{\ displaystyle \ {r (x) {\ hat {x}} \ | \ r (x) = \ | r \ | _ {\ infty} \}}![{\ displaystyle \ {r (x) {\ hat {x}} \ | \ r (x) = \ | r \ | _ {\ infty} \}}](https://wikimedia.org/api/rest_v1/media/math/render/svg/1882c46c818289dc45ee84475b2cf3aa0f0ce52b)
Demonstrace
Dostatečný stav
Postupujme kontraposivně a předpokládejme, že to není minimální. Pak je možné najít zobecněný polynom, který splňuje lepší aproximační chybu. Jinými slovy, existují například .
‖r‖∞{\ displaystyle \ | r \ | _ {\ infty}}
d=(d1,...,dne){\ displaystyle d = (d_ {1}, \ tečky, d_ {n})}
‖∑i=1ne(αi∗-di)Gi‖∞<‖r‖∞{\ displaystyle \ left \ | \ sum _ {i = 1} ^ {n} (\ alpha _ {i} ^ {*} - d_ {i}) g_ {i} \ right \ | _ {\ infty} < \ | r \ | _ {\ infty}}![{\ displaystyle \ left \ | \ sum _ {i = 1} ^ {n} (\ alpha _ {i} ^ {*} - d_ {i}) g_ {i} \ right \ | _ {\ infty} < \ | r \ | _ {\ infty}}](https://wikimedia.org/api/rest_v1/media/math/render/svg/16f349a59a08eccc7b371d1149ed8c0dc83d3b87)
Pojďme pózovat . Takže za všechno, co máme
X={X∈[na,b] | |r(X)|=‖r‖∞}{\ displaystyle X = \ {x \ v [a, b] \ | \ | r (x) | = \ | r \ | _ {\ infty} \}}
X∈X{\ displaystyle x \ v X}![x \ v X](https://wikimedia.org/api/rest_v1/media/math/render/svg/3e580967f68f36743e894aa7944f032dda6ea01d)
|r(X)-∑i=1nediGi(X)|≤‖r-∑i=1nediGi‖∞=‖∑i=1ne(αi∗-di)Gi‖∞<‖r‖∞=|r(X)|{\ displaystyle \ left | r (x) - \ sum _ {i = 1} ^ {n} d_ {i} g_ {i} (x) \ right | \ leq \ left \ | r- \ sum _ {i = 1} ^ {n} d_ {i} g_ {i} \ right \ | _ {\ infty} = \ left \ | \ sum _ {i = 1} ^ {n} (\ alpha _ {i} ^ { *} - d_ {i}) g_ {i} \ right \ | _ {\ infty} <\ | r \ | _ {\ infty} = | r (x) |}![{\ displaystyle \ left | r (x) - \ sum _ {i = 1} ^ {n} d_ {i} g_ {i} (x) \ right | \ leq \ left \ | r- \ sum _ {i = 1} ^ {n} d_ {i} g_ {i} \ right \ | _ {\ infty} = \ left \ | \ sum _ {i = 1} ^ {n} (\ alpha _ {i} ^ { *} - d_ {i}) g_ {i} \ right \ | _ {\ infty} <\ | r \ | _ {\ infty} = | r (x) |}](https://wikimedia.org/api/rest_v1/media/math/render/svg/1f7322ccec02c057bdeb702a56380fbf39442221)
Vyrovnáním členů nerovnosti
(r(X)-∑i=1nediGi(X))2<r(X)2{\ displaystyle \ left (r (x) - \ součet _ {i = 1} ^ {n} d_ {i} g_ {i} (x) \ right) ^ {2} <r (x) ^ {2} }![{\ displaystyle \ left (r (x) - \ součet _ {i = 1} ^ {n} d_ {i} g_ {i} (x) \ right) ^ {2} <r (x) ^ {2} }](https://wikimedia.org/api/rest_v1/media/math/render/svg/bec1dc2e56ab47562feccb45355d2b7147f65afa)
Poté vývojem
2r(X)∑i=1nediGi(X)>(∑i=1nediGi(X))2{\ displaystyle 2r (x) \ součet _ {i = 1} ^ {n} d_ {i} g_ {i} (x)> \ left (\ sum _ {i = 1} ^ {n} d_ {i} g_ {i} (x) \ right) ^ {2}}![{\ displaystyle 2r (x) \ součet _ {i = 1} ^ {n} d_ {i} g_ {i} (x)> \ left (\ sum _ {i = 1} ^ {n} d_ {i} g_ {i} (x) \ right) ^ {2}}](https://wikimedia.org/api/rest_v1/media/math/render/svg/fd0fb257c593b0d45f9a330565fb0e47f8de4775)
a
⟨d,r(X)X^⟩=r(X)∑i=1nediGi(X)>0{\ displaystyle \ langle d, r (x) {\ hat {x}} \ rangle = r (x) \ součet _ {i = 1} ^ {n} d_ {i} g_ {i} (x)> 0 }![{\ displaystyle \ langle d, r (x) {\ hat {x}} \ rangle = r (x) \ součet _ {i = 1} ^ {n} d_ {i} g_ {i} (x)> 0 }](https://wikimedia.org/api/rest_v1/media/math/render/svg/6fc2b34ad50b4653f4ecc31319d7926e4d9735c6)
Nyní tedy jde o to ukázat, že 0 není v konvexní obálce , což je podmnožina , a my pak dokážeme kontrapozici. Předpokládejme tedy opak. Existuje a takové, že a . Tak
{r(X)X^ | X∈X}{\ displaystyle \ {r (x) {\ hat {x}} \ | \ x \ v X \}}
Rne{\ displaystyle \ mathbb {R} ^ {n}}
X1,...,Xne∈X{\ displaystyle x_ {1}, \ dots, x_ {n} \ v X}
na1,...nane∈[0,1]{\ displaystyle a_ {1}, \ tečky a_ {n} \ v [0,1]}
∑i=1nenair(Xi)Xi^=0{\ displaystyle \ sum _ {i = 1} ^ {n} a_ {i} r (x_ {i}) {\ hat {x_ {i}}} = 0}
∑i=1nenai=1{\ displaystyle \ sum _ {i = 1} ^ {n} a_ {i} = 1}![{\ displaystyle \ sum _ {i = 1} ^ {n} a_ {i} = 1}](https://wikimedia.org/api/rest_v1/media/math/render/svg/e15ba918318df8f80f84cc0164b3b9a4cc347433)
0=⟨d,0⟩=⟨d,∑i=1nenair(Xi)Xi^⟩=∑i=1nenai⟨d,r(Xi)Xi^⟩>0{\ displaystyle 0 = \ left \ langle {d, 0} \ right \ rangle = \ left \ langle {d, \ sum _ {i = 1} ^ {n} a_ {i} r (x_ {i}) { \ hat {x_ {i}}}} \ right \ rangle = \ sum _ {i = 1} ^ {n} a_ {i} \ langle {d, r (x_ {i}) {\ hat {x_ {i }}}} \ rangle> 0}![{\ displaystyle 0 = \ left \ langle {d, 0} \ right \ rangle = \ left \ langle {d, \ sum _ {i = 1} ^ {n} a_ {i} r (x_ {i}) { \ hat {x_ {i}}}} \ right \ rangle = \ sum _ {i = 1} ^ {n} a_ {i} \ langle {d, r (x_ {i}) {\ hat {x_ {i }}}} \ rangle> 0}](https://wikimedia.org/api/rest_v1/media/math/render/svg/1cdb0278127a7db6c0aff87dea5025db6fd43882)
To je samozřejmě absurdní, CQFD.
Požadovaný stav
Rovněž postupujeme kontrapozicí. Předpokládejme tedy, že 0 není v konvexní obálce C množiny . C je uzavřeno, protože se jedná o konvexní obálku. Je omezený, protože „je. Ve skutečnosti r a g i jsou spojité a X je obsaženo v omezeném intervalu. C je proto uzavřeno ohraničené v konečné dimenzi (obsažené v ), je tedy kompaktní. Tak dosahuje minima na C , řekněme v . Zejména . Buď svévolné a buď . Konvexitou . Pak
{r(X)X^ | r(X)=‖r‖∞}={r(X)X^ | X∈X}{\ displaystyle \ {r (x) {\ hat {x}} \ | \ r (x) = \ | r \ | _ {\ infty} \} = \ {r (x) {\ hat {x}} \ | \ x \ v X \}}
{r(X)X^ | r(X)=‖r‖∞}{\ displaystyle \ {r (x) {\ hat {x}} \ | \ r (x) = \ | r \ | _ {\ infty} \}}
Rne{\ displaystyle \ mathbb {R} ^ {n}}
‖⋅‖2{\ displaystyle \ | \ cdot \ | _ {2}}
d∈VS{\ displaystyle d \ v C}
d≠0{\ displaystyle d \ neq 0}
u∈VS{\ displaystyle u \ v C}
λ∈[0,1]{\ displaystyle \ lambda \ v [0,1]}
λu+(1-λ)d∈VS{\ displaystyle \ lambda u + (1- \ lambda) d \ v C}![{\ displaystyle \ lambda u + (1- \ lambda) d \ v C}](https://wikimedia.org/api/rest_v1/media/math/render/svg/5d099e05e156a549828b2a34bb282207bbb445ab)
‖λu+(1-λ)d‖22≥‖d‖22‖λu+(1-λ)d‖22-‖d‖22≥0λ2‖u-d‖22+2λ⟨u-d,d⟩≥0{\ displaystyle {\ begin {zarovnáno} \ | {\ lambda u + (1- \ lambda) d} \ | _ {2} ^ {2} & \ geq & \ | {d} \ | _ {2} ^ {2} \\\ | {\ lambda u + (1- \ lambda) d} \ | _ {2} ^ {2} - \ | {d} \ | _ {2} ^ {2} & \ geq & 0 \\ \ lambda ^ {2} \ | {ud} \ | _ {2} ^ {2} +2 \ lambda \ langle {ud, d} \ rangle & \ geq & 0 \ end {zarovnáno}}}![{\ displaystyle {\ begin {zarovnáno} \ | {\ lambda u + (1- \ lambda) d} \ | _ {2} ^ {2} & \ geq & \ | {d} \ | _ {2} ^ {2} \\\ | {\ lambda u + (1- \ lambda) d} \ | _ {2} ^ {2} - \ | {d} \ | _ {2} ^ {2} & \ geq & 0 \\ \ lambda ^ {2} \ | {ud} \ | _ {2} ^ {2} +2 \ lambda \ langle {ud, d} \ rangle & \ geq & 0 \ end {zarovnáno}}}](https://wikimedia.org/api/rest_v1/media/math/render/svg/3f9cb510732c223f447cc06aeb758957cb29e289)
Pro dostatečně malé je však tato nerovnost porušena . Takže . Takže pro všechny , . X je uzavřený obsažený v C , takže je také kompaktní. Pro plynulost r i g i , připouští minimální . Za to, co musíme udělat . Poznámka . Poté budeme hledat takové , které budou uzavřeny. Pojďme nyní pózovat . Podle definice . Pokud jde o ostatní, Y je stále kompaktní. Nechť R je tedy maximum | r | na Y . Pokud ne, pak máme maximum, pak spokojeni , což je absurdní. Takže pokud ,
λ{\ displaystyle \ lambda}
⟨u-d,d⟩<0{\ displaystyle \ langle {ud, d} \ rangle <0}
⟨u-d,d⟩≥0{\ displaystyle \ langle {ud, d} \ rangle \ geq 0}
u∈VS{\ displaystyle u \ v C}
⟨u,d⟩=⟨u-d,d⟩+‖d‖22≥‖d‖22>0{\ displaystyle \ langle {u, d} \ rangle = \ langle {ud, d} \ rangle + \ | {d} \ | _ {2} ^ {2} \ geq \ | {d} \ | _ {2 } ^ {2}> 0}
{⟨d,r(X)X^⟩ | X∈X}{\ displaystyle \ {\ langle {d, r (x) {\ hat {x}}} \ rangle \ | \ x \ v X \}}
ϵ{\ displaystyle \ epsilon}
ϵ>0{\ displaystyle \ epsilon> 0}
d=(d1,...,dne)T{\ displaystyle d = (d_ {1}, \ tečky, d_ {n}) ^ {T}}
μ>0{\ displaystyle \ mu> 0}
‖r-μ∑i=1nediGi‖∞<‖r‖∞{\ displaystyle \ left \ | {r- \ mu \ sum _ {i = 1} ^ {n} d_ {i} g_ {i}} \ right \ | _ {\ infty} <\ | {r} \ | _ {\ infty}}
Y={X∈[na,b]] | ⟨d,r(X)X^⟩≤ϵ2}{\ displaystyle Y = \ left \ {x \ in [a, b]] \ | \ \ langle {d, r (x) {\ hat {x}}} \ rangle \ leq {\ frac {\ epsilon} { 2}} \ doprava \}}
Y∩X=∅{\ displaystyle Y \ cap X = \ emptyset}
R<‖r‖∞{\ displaystyle R <\ | {r} \ | _ {\ infty}}
y∈Y{\ displaystyle y \ v Y}
y∈X{\ displaystyle y \ v X}
X∈Y{\ displaystyle x \ v Y}![{\ displaystyle x \ v Y}](https://wikimedia.org/api/rest_v1/media/math/render/svg/3df349a03b91b999fa3741fb41bccb1a8023ee42)
∀X∈Y,|r(X)-μ∑i=1nediGi(X)|≤|r(X)|+μ|∑i=1nediGi(X)|≤R+μ‖∑i=1nediGi‖∞{\ displaystyle \ forall x \ in Y, \, \ left | r (x) - \ mu \ sum _ {i = 1} ^ {n} d_ {i} g_ {i} (x) \ right | \ leq | r (x) | + \ mu \ left | \ sum _ {i = 1} ^ {n} d_ {i} g_ {i} (x) \ right | \ leq R + \ mu \ left \ | {\ součet _ {i = 1} ^ {n} d_ {i} g_ {i}} \ doprava \ | _ {\ infty}}![{\ displaystyle \ forall x \ in Y, \, \ left | r (x) - \ mu \ sum _ {i = 1} ^ {n} d_ {i} g_ {i} (x) \ right | \ leq | r (x) | + \ mu \ left | \ sum _ {i = 1} ^ {n} d_ {i} g_ {i} (x) \ right | \ leq R + \ mu \ left \ | {\ součet _ {i = 1} ^ {n} d_ {i} g_ {i}} \ doprava \ | _ {\ infty}}](https://wikimedia.org/api/rest_v1/media/math/render/svg/3098f9f590f451fbcac7357d93d3d678188f6aab)
Pokud teď tedy
X∉Y{\ displaystyle x \ notin Y}![{\ displaystyle x \ notin Y}](https://wikimedia.org/api/rest_v1/media/math/render/svg/61a1c910a28cde64d79d2e30fd8ca356907358ec)
|r(X)-μ∑i=1nediGi(X)|2=r(X)2-2μ∑i=1nedir(X)Gi(X)+μ2(∑i=1nediGi(X))2≤‖r‖∞2-2μ⟨d,r(X)X^⟩+μ2(∑i=1nediGi(X))2≤‖r‖∞2-2μϵ2+μ2(∑i=1nediGi(X))2protože X∉Y≤‖r‖∞2+μ(-ϵ+μ‖∑i=1nediGi‖∞2){\ displaystyle {\ begin {zarovnáno} \ left | r (x) - \ mu \ sum _ {i = 1} ^ {n} d_ {i} g_ {i} (x) \ right | ^ {2} & = & r (x) ^ {2} -2 \ mu \ sum _ {i = 1} ^ {n} d_ {i} r (x) g_ {i} (x) + \ mu ^ {2} \ vlevo (\ sum _ {i = 1} ^ {n} d_ {i} g_ {i} (x) \ right) ^ {2} \\ & \ leq & \ | {r} \ | _ {\ infty} ^ {2} -2 \ mu \ langle {d, r (x) {\ hat {x}}} \ rangle + \ mu ^ {2} \ left (\ sum _ {i = 1} ^ {n} d_ { i} g_ {i} (x) \ right) ^ {2} \\ & \ leq & \ | {r} \ | _ {\ infty} ^ {2} -2 \ mu {\ frac {\ epsilon} { 2}} + \ mu ^ {2} \ left (\ sum _ {i = 1} ^ {n} d_ {i} g_ {i} (x) \ right) ^ {2} & {\ textrm {car} } \ x \ notin Y \\ & \ leq & \ | {r} \ | _ {\ infty} ^ {2} + \ mu \ left (- \ epsilon + \ mu \ left \ | {\ sum _ {i = 1} ^ {n} d_ {i} g_ {i}} \ doprava \ | _ {\ infty} ^ {2} \ doprava) \ end {zarovnáno}}}![{\ displaystyle {\ begin {zarovnáno} \ left | r (x) - \ mu \ sum _ {i = 1} ^ {n} d_ {i} g_ {i} (x) \ right | ^ {2} & = & r (x) ^ {2} -2 \ mu \ sum _ {i = 1} ^ {n} d_ {i} r (x) g_ {i} (x) + \ mu ^ {2} \ vlevo (\ sum _ {i = 1} ^ {n} d_ {i} g_ {i} (x) \ right) ^ {2} \\ & \ leq & \ | {r} \ | _ {\ infty} ^ {2} -2 \ mu \ langle {d, r (x) {\ hat {x}}} \ rangle + \ mu ^ {2} \ left (\ sum _ {i = 1} ^ {n} d_ { i} g_ {i} (x) \ right) ^ {2} \\ & \ leq & \ | {r} \ | _ {\ infty} ^ {2} -2 \ mu {\ frac {\ epsilon} { 2}} + \ mu ^ {2} \ left (\ sum _ {i = 1} ^ {n} d_ {i} g_ {i} (x) \ right) ^ {2} & {\ textrm {car} } \ x \ notin Y \\ & \ leq & \ | {r} \ | _ {\ infty} ^ {2} + \ mu \ left (- \ epsilon + \ mu \ left \ | {\ sum _ {i = 1} ^ {n} d_ {i} g_ {i}} \ doprava \ | _ {\ infty} ^ {2} \ doprava) \ end {zarovnáno}}}](https://wikimedia.org/api/rest_v1/media/math/render/svg/1d4841d49bfabe90ad86ab828f90d6fc721a1c1b)
Takže pro , máme
0<μ<min(‖r‖∞-R2‖∑i=1nediGi‖∞,ϵ2‖∑i=1nediGi‖∞2){\ displaystyle 0 <\ mu <\ min \ left ({\ frac {\ | {r} \ | _ {\ infty} -R} {2 \ | {\ sum _ {i = 1} ^ {n} d_ {i} g_ {i}} \ | _ {\ infty}}}, {\ frac {\ epsilon} {2 \ | {\ sum _ {i = 1} ^ {n} d_ {i} g_ {i} } \ | _ {\ infty} ^ {2}}} \ vpravo)}![{\ displaystyle 0 <\ mu <\ min \ left ({\ frac {\ | {r} \ | _ {\ infty} -R} {2 \ | {\ sum _ {i = 1} ^ {n} d_ {i} g_ {i}} \ | _ {\ infty}}}, {\ frac {\ epsilon} {2 \ | {\ sum _ {i = 1} ^ {n} d_ {i} g_ {i} } \ | _ {\ infty} ^ {2}}} \ vpravo)}](https://wikimedia.org/api/rest_v1/media/math/render/svg/bb83fab619efe3365aea840654cedf74b13aa8f2)
|r(X)-μ∑i=1nediGi(X)|<‖r‖∞+R2pro X∈Y|r(X)-μ∑i=1nediGi(X)|2<‖r‖∞2-μϵ2pro X∉Y{\ displaystyle {\ begin {zarovnáno} \ left | r (x) - \ mu \ sum _ {i = 1} ^ {n} d_ {i} g_ {i} (x) \ right | & <& {\ frac {\ | {r} \ | _ {\ infty} + R} {2}} & \ quad {\ textrm {pour}} \ x \ v Y \\\ vlevo | r (x) - \ mu \ sum _ {i = 1} ^ {n} d_ {i} g_ {i} (x) \ right | ^ {2} & <& \ | {r} \ | _ {\ infty} ^ {2} - {\ frac {\ mu \ epsilon} {2}} & \ quad {\ textrm {pour}} \ x \ notin Y \ end {zarovnáno}}}![{\ displaystyle {\ begin {zarovnáno} \ left | r (x) - \ mu \ sum _ {i = 1} ^ {n} d_ {i} g_ {i} (x) \ right | & <& {\ frac {\ | {r} \ | _ {\ infty} + R} {2}} & \ quad {\ textrm {pour}} \ x \ v Y \\\ vlevo | r (x) - \ mu \ sum _ {i = 1} ^ {n} d_ {i} g_ {i} (x) \ right | ^ {2} & <& \ | {r} \ | _ {\ infty} ^ {2} - {\ frac {\ mu \ epsilon} {2}} & \ quad {\ textrm {pour}} \ x \ notin Y \ end {zarovnáno}}}](https://wikimedia.org/api/rest_v1/media/math/render/svg/d2fce57ca7a9276dd4305ddfba5f1e01319bef4b)
Tedy ,, a proto není minimální.
‖r-μ∑i=1nediGi‖∞<‖r‖∞{\ displaystyle \ left \ | {r- \ mu \ sum _ {i = 1} ^ {n} d_ {i} g_ {i}} \ right \ | _ {\ infty} <\ | {r} \ | _ {\ infty}}
r{\ displaystyle r}![r](https://wikimedia.org/api/rest_v1/media/math/render/svg/0d1ecb613aa2984f0576f70f86650b7c2a132538)
Alternativní lemma
Existuje souvislost mezi skutečností, že 0 je v konvexní obálce a že existuje střídání znamének.
Zvažte systém Čebyšev. Nechť a být konstanty ne . Pak 0 je v konvexním trupu if a pouze pokud pro máme .{G1,...,Gne}⊆VS([na,b]){\ displaystyle \ {g_ {1}, \ tečky, g_ {n} \} \ subseteq {\ mathcal {C}} ([a, b])}
na≤X0<⋯<Xne≤b{\ displaystyle a \ leq x_ {0} <\ cdots <x_ {n} \ leq b}
λ0,...,λne∈R∗{\ displaystyle \ lambda _ {0}, \ tečky, \ lambda _ {n} \ in \ mathbb {R} ^ {*}}
{λiXi^ | i∈{1,...,ne}}{\ displaystyle \ {\ lambda _ {i} {\ hat {x_ {i}}} \ | \ i \ v \ {1, \ tečky, n \} \}}
i∈{1,...,ne}{\ displaystyle i \ in \ {1, \ tečky, n \}}
λiλi-1<0{\ displaystyle \ lambda _ {i} \ lambda _ {i-1} <0}![{\ displaystyle \ lambda _ {i} \ lambda _ {i-1} <0}](https://wikimedia.org/api/rest_v1/media/math/render/svg/5747545894696a3d9f9fbcd11d8540f6d7e33893)
Důkaz lemmatu
Začněme pro determinant
X1<⋯<Xne{\ displaystyle x_ {1} <\ cdots <x_ {n}}![{\ displaystyle x_ {1} <\ cdots <x_ {n}}](https://wikimedia.org/api/rest_v1/media/math/render/svg/05483a1304836c77b35122b2bfcfe14d5ccc1326)
D(X1,...,Xne)=|G1(X1)⋯Gne(X1)⋮⋮G1(Xne)⋯Gne(Xne)|{\ displaystyle D (x_ {1}, \ dots, x_ {n}) = \ left | {\ begin {matrix} g_ {1} (x_ {1}) & \ cdots & g_ {n} (x_ {1 }) \\\ vdots && \ vdots \\ g_ {1} (x_ {n}) & \ cdots & g_ {n} (x_ {n}) \ end {matrix}} \ right |}![{\ displaystyle D (x_ {1}, \ dots, x_ {n}) = \ left | {\ begin {matrix} g_ {1} (x_ {1}) & \ cdots & g_ {n} (x_ {1 }) \\\ vdots && \ vdots \\ g_ {1} (x_ {n}) & \ cdots & g_ {n} (x_ {n}) \ end {matrix}} \ right |}](https://wikimedia.org/api/rest_v1/media/math/render/svg/c80077fc74b2d350beb375de382a670ab491eaad)
.
Ukážeme, že všechny tyto determinanty jsou přísně pozitivní nebo všechny přísně negativní. Nejprve jsou nenulové, protože systém vyhovuje Haarovým podmínkám. Předpokládejme, že to je pro a my
{G1,...,Gne}{\ displaystyle \ {g_ {1}, \ tečky, g_ {n} \}}
X1<⋯<Xne{\ displaystyle x_ {1} <\ cdots <x_ {n}}
y1<⋅<yne{\ displaystyle y_ {1} <\ cdot <y_ {n}}![{\ displaystyle y_ {1} <\ cdot <y_ {n}}](https://wikimedia.org/api/rest_v1/media/math/render/svg/f20afd22ca1a6287ed7915e1f35e143888fca93f)
D(X1,...,Xne)<0<D(y1,...,yne){\ displaystyle D (x_ {1}, \ tečky, x_ {n}) <0 <D (y_ {1}, \ tečky, y_ {n})}![{\ displaystyle D (x_ {1}, \ tečky, x_ {n}) <0 <D (y_ {1}, \ tečky, y_ {n})}](https://wikimedia.org/api/rest_v1/media/math/render/svg/f1c75f319af888af96059adfc5361841876e97a6)
. Pak podle
věty o mezilehlých hodnotách aplikovaných na máme existenci takových , která je nemožná Haarovými podmínkami. Všechny tyto determinanty tedy mají stejné znaménko.
λ↦D(λX1+(1-λ)y1,...,λXne+(1-λ)yne){\ displaystyle \ lambda \ mapsto D (\ lambda x_ {1} + (1- \ lambda) y_ {1}, \ tečky, \ lambda x_ {n} + (1- \ lambda) y_ {n})}
λ∈[0,1]{\ displaystyle \ lambda \ v [0,1]}
D(λX1+(1-λ)y1,...,λXne+(1-λ)yne)=0{\ displaystyle D (\ lambda x_ {1} + (1- \ lambda) y_ {1}, \ tečky, \ lambda x_ {n} + (1- \ lambda) y_ {n}) = 0}![{\ displaystyle D (\ lambda x_ {1} + (1- \ lambda) y_ {1}, \ tečky, \ lambda x_ {n} + (1- \ lambda) y_ {n}) = 0}](https://wikimedia.org/api/rest_v1/media/math/render/svg/3cca038241d4d1b01d4008cbefb260c42d842816)
Proto je 0 v konvexní obálce if a only if there such such that and . Pokud ano . Podle Haarových podmínek však tvoří základ prostoru, a proto jsou všechny nulové, což není proto, že jejich součet se rovná 1. Proto . Podobně pro každý i , . Zejména . Vyřešením tohoto lineárního systému podle Cramerových pravidel máme
λiXi^{\ displaystyle \ lambda _ {i} {\ hat {x_ {i}}}}
α0,...,αne∈[0,1]{\ displaystyle \ alpha _ {0}, \ tečky, \ alpha _ {n} \ v [0,1]}
0=∑i=0neαiλiXi^{\ displaystyle 0 = \ součet _ {i = 0} ^ {n} \ alpha _ {i} \ lambda _ {i} {\ hat {x_ {i}}}}
∑i=0neαi=1{\ displaystyle \ sum _ {i = 0} ^ {n} \ alpha _ {i} = 1}
α0=0{\ displaystyle \ alpha _ {0} = 0}
∑i=1neαiλiXi^=0{\ displaystyle \ sum _ {i = 1} ^ {n} \ alpha _ {i} \ lambda _ {i} {\ hat {x_ {i}}} = 0}
λiXi^{\ displaystyle \ lambda _ {i} {\ hat {x_ {i}}}}
Rne{\ displaystyle \ mathbb {R} ^ {n}}
αi{\ displaystyle \ alpha _ {i}}
α0≠0{\ displaystyle \ alpha _ {0} \ neq 0}
αi≠0{\ displaystyle \ alpha _ {i} \ neq 0}
X0^=∑i=1ne-λiαiλ0α0Xi^{\ displaystyle {\ hat {x_ {0}}} = \ součet _ {i = 1} ^ {n} {\ frac {- \ lambda _ {i} \ alpha _ {i}} {\ lambda _ {0 } \ alpha _ {0}}} {\ hat {x_ {i}}}}![{\ displaystyle {\ hat {x_ {0}}} = \ součet _ {i = 1} ^ {n} {\ frac {- \ lambda _ {i} \ alpha _ {i}} {\ lambda _ {0 } \ alpha _ {0}}} {\ hat {x_ {i}}}}](https://wikimedia.org/api/rest_v1/media/math/render/svg/f944170b86f58b1446c1ebba56d87f0b0f127f9a)
-λiαiλ0α0=D(X1,...,Xi-1,X0,Xi+1,...,Xne)D(X1,...,Xne)=(-1)i-1D(X0,...,Xi-1,Xi+1,...,Xne)D(X1,...,Xne){\ displaystyle {\ frac {- \ lambda _ {i} \ alpha _ {i}} {\ lambda _ {0} \ alpha _ {0}}} = {\ frac {D (x_ {1}, \ tečky , x_ {i-1}, x_ {0}, x_ {i + 1}, \ dots, x_ {n})} {D (x_ {1}, \ dots, x_ {n})}} = {\ frac {(-1) ^ {i-1} D (x_ {0}, \ dots, x_ {i-1}, x_ {i + 1}, \ dots, x_ {n})} {D (x_ { 1}, \ tečky, x_ {n})}}}![{\ displaystyle {\ frac {- \ lambda _ {i} \ alpha _ {i}} {\ lambda _ {0} \ alpha _ {0}}} = {\ frac {D (x_ {1}, \ tečky , x_ {i-1}, x_ {0}, x_ {i + 1}, \ dots, x_ {n})} {D (x_ {1}, \ dots, x_ {n})}} = {\ frac {(-1) ^ {i-1} D (x_ {0}, \ dots, x_ {i-1}, x_ {i + 1}, \ dots, x_ {n})} {D (x_ { 1}, \ tečky, x_ {n})}}}](https://wikimedia.org/api/rest_v1/media/math/render/svg/75c1433a42cb8ce7c75272613259653d4ab88a87)
Pak,
λiλ0=(-1)iD(X0,...,Xi-1,Xi+1,...,Xne)α0D(X1,...,Xne)αi{\ displaystyle {\ frac {\ lambda _ {i}} {\ lambda _ {0}}} = {\ frac {(-1) ^ {i} D (x_ {0}, \ tečky, x_ {i- 1}, x_ {i + 1}, \ dots, x_ {n}) \ alpha _ {0}} {D (x_ {1}, \ dots, x_ {n}) \ alpha _ {i}}}}![{\ displaystyle {\ frac {\ lambda _ {i}} {\ lambda _ {0}}} = {\ frac {(-1) ^ {i} D (x_ {0}, \ tečky, x_ {i- 1}, x_ {i + 1}, \ dots, x_ {n}) \ alpha _ {0}} {D (x_ {1}, \ dots, x_ {n}) \ alpha _ {i}}}}](https://wikimedia.org/api/rest_v1/media/math/render/svg/f3ad6dfaf47219e8c995deb4d5711d8a5e19a8db)
Všechny determinanty jsou stejného znaménka, jsou přísně pozitivní. Takže , to znamená, že se střídají ve znamení, ani to, že za všechno , (protože nejsou nula).
αi{\ displaystyle \ alpha _ {i}}
sgnλi=(-1)isgnλ0{\ displaystyle {\ textrm {sgn}} \ lambda _ {i} = (- 1) ^ {i} {\ textrm {sgn}} \ lambda _ {0}}
λi{\ displaystyle \ lambda _ {i}}
i∈{1,...,ne}{\ displaystyle i \ in \ {1, \ tečky, n \}}
λiλi-1<0{\ displaystyle \ lambda _ {i} \ lambda _ {i-1} <0}![{\ displaystyle \ lambda _ {i} \ lambda _ {i-1} <0}](https://wikimedia.org/api/rest_v1/media/math/render/svg/5747545894696a3d9f9fbcd11d8540f6d7e33893)
Důkaz alternační věty
Teď použijeme teorém a lemma, které jsme dříve prokázali, abychom dokázali alternační teorém. Bereme notace prohlášení.
Máme, že p * je nejlepší aproximace f pro jednotnou normu právě tehdy, když r * má minimální jednotnou normu. Podle věty o charakterizaci je to pravda právě tehdy, když 0 je v konvexním trupu . Existuje tedy as tím , že to porušuje Haarovy podmínky, pokud k < n . Takže máme . I když to znamená opětovné indexování, vezmeme je ve vzestupném pořadí . Podle Haarových podmínek, jako v lemmatu, jsou všechny nenulové. Proto použijeme lemma a střídání znaménka. Jelikož jsou kladná, střídají se znamení. Tím se tedy uzavírá důkaz.
{r(X)X^ | X∈X}{\ displaystyle \ {r (x) {\ hat {x}} \ | \ x \ v X \}}
X0,...,Xk∈X{\ displaystyle x_ {0}, \ dots, x_ {k} \ v X}
α0,...αk∈[0,1]{\ displaystyle \ alpha _ {0}, \ dots \ alpha _ {k} \ v [0,1]}
k≤ne{\ displaystyle k \ leq n}
0=∑i=1kαir(Xi)Xi^{\ displaystyle 0 = \ součet _ {i = 1} ^ {k} \ alpha _ {i} r (x_ {i}) {\ hat {x_ {i}}}}
k=ne{\ displaystyle k = n}
Xi{\ displaystyle x_ {i}}
na≤X0<⋯<Xne≤b{\ displaystyle a \ leq x_ {0} <\ cdots <x_ {n} \ leq b}
αir(Xi){\ displaystyle \ alpha _ {i} r (x_ {i})}
αi{\ displaystyle \ alpha _ {i}}
r(Xi){\ displaystyle r (x_ {i})}![{\ displaystyle r (x_ {i})}](https://wikimedia.org/api/rest_v1/media/math/render/svg/ea24eb7f854d25c0e76c3da0159d64a5cda4296b)
Jedinečnost nejlepší aproximace
Dosud jsme charakterizovali, jaké je nejlepší přiblížení. Nyní ukážeme, že nejlepší aproximace existuje a je jedinečná.
Státy
Zvažte systém Čebyšev. Nechť je spojitá funkce. Pak je tu jedinečná nejlepší aproximace v .
{G1,...,Gne}⊆VS([na,b]){\ displaystyle \ {g_ {1}, \ tečky, g_ {n} \} \ subseteq {\ mathcal {C}} ([a, b])}
F∈VS([na,b]){\ displaystyle f \ in {\ mathcal {C}} ([a, b])}
F{\ displaystyle f}
Vect(G1,...,Gne){\ displaystyle {\ textrm {Vect}} (g_ {1}, \ dots, g_ {n})}![{\ displaystyle {\ textrm {Vect}} (g_ {1}, \ dots, g_ {n})}](https://wikimedia.org/api/rest_v1/media/math/render/svg/79a2ab8e9acdc41298621139f68ec784af20161d)
Demonstrace
Začněme s jedinečností. Takže předpokládám, že i jsou nejlepší aproximace k . Takže to máme a tento standard je minimální. Zlato pak máme . Takže je ještě lepší přiblížení. Nechť je dána alternační větou pro . Předpokládejme to . Alespoň jeden z nich tedy nestojí za to , řekněme, i když to znamená přejmenování atd . My máme
p{\ displaystyle p}
q{\ displaystyle q}
F{\ displaystyle f}
‖F-p‖∞=‖F-q‖∞{\ displaystyle \ | {fp} \ | _ {\ infty} = \ | {fq} \ | _ {\ infty}}
‖F-p+q2‖∞≤‖F-p‖∞{\ displaystyle \ left \ | {f - {\ frac {p + q} {2}}} \ right \ | _ {\ infty} \ leq \ | {fp} \ | _ {\ infty}}
r=p+q2{\ displaystyle r = {\ frac {p + q} {2}}}
X0<⋯<Xne{\ displaystyle x_ {0} <\ cdots <x_ {n}}
r{\ displaystyle r}
p(Xi)≠q(Xi){\ Displaystyle p (x_ {i}) \ neq q (x_ {i})}
r(Xi){\ displaystyle r (x_ {i})}
q(Xi){\ displaystyle q (x_ {i})}
|F(Xi)-q(Xi)|<‖F-r‖∞{\ displaystyle | f (x_ {i}) - q (x_ {i}) | <\ | {fr} \ | _ {\ infty}}![{\ displaystyle | f (x_ {i}) - q (x_ {i}) | <\ | {fr} \ | _ {\ infty}}](https://wikimedia.org/api/rest_v1/media/math/render/svg/b2cb31c373541f9b7632ea7ab9936d30984a28f3)
‖F-r‖∞=|F(Xi)-r(Xi)|≤12|F(Xi)-p(Xi)|+12|F(Xi)-q(Xi)|<‖F-r‖∞{\ displaystyle \ | {en} \ | _ {\ infty} = | f (x_ {i}) - r (x_ {i}) | \ leq {\ frac {1} {2}} | f (x_ { i}) - p (x_ {i}) | + {\ frac {1} {2}} | f (x_ {i}) - q (x_ {i}) | <\ | {fr} \ | _ { \ infty}}
. To je nesmysl. Takže . Takže s výraznými nulami. Podle Haarových podmínek tedy zjistíme, že je identicky nulový, a tedy to . Máme tedy jedinečnost.
r(Xi)=p(Xi)=q(Xi){\ displaystyle r (x_ {i}) = p (x_ {i}) = q (x_ {i})}
p-q{\ displaystyle pq}
ne+1{\ displaystyle n + 1}
p=q{\ displaystyle p = q}![p = q](https://wikimedia.org/api/rest_v1/media/math/render/svg/4cf52da7809003406aee7e680eb5476a05a5c546)
Pojďme nyní k demonstraci existence. Zvažte . Tato sada je jasně uzavřená a omezená. Je to neprázdné, protože funkce null je in a je konečné dimenze. Takže je kompaktní. Tím, že je nepřetržitě zapnuto , tam dosáhne minima, řekněme v . Nyní, pokud je nejlepší aproximace pak trojúhelníkovou nerovností. Takže . Takže je mnohem lepší aproximace pro .
F={p∈Vect(G1,...,Gne) | ‖p‖∞≤2‖F‖∞}{\ displaystyle F = \ {p \ in {\ textrm {Vect}} (g_ {1}, \ dots, g_ {n}) \ | \ \ | {p} \ | _ {\ infty} \ leq 2 \ | {f} \ | _ {\ infty} \}}
F{\ displaystyle F}
Vect(G1,...,Gne){\ displaystyle {\ textrm {Vect}} (g_ {1}, \ dots, g_ {n})}
F{\ displaystyle F}
p↦‖F-p‖∞{\ displaystyle p \ mapsto \ | {fp} \ | _ {\ infty}}
F{\ displaystyle F}
p∗{\ displaystyle p ^ {*}}
p{\ displaystyle p}
F{\ displaystyle f}
‖p‖∞-‖F‖∞≤‖F-p‖∞≤‖F‖∞{\ displaystyle \ | {p} \ | _ {\ infty} - \ | {f} \ | _ {\ infty} \ leq \ | {fp} \ | _ {\ infty} \ leq \ | {f} \ | _ {\ infty}}
p∈F{\ displaystyle p \ in F}
p∗{\ displaystyle p ^ {*}}
F{\ displaystyle f}![F](https://wikimedia.org/api/rest_v1/media/math/render/svg/132e57acb643253e7810ee9702d9581f159a1c61)
Podívejte se také
Zdroje
-
(in) CHENEY EW, Úvod do teorie aproximace ,1966
-
(in) POWEL MJD, teorie a metody aproximace, Univetrsity Cambridge Press,devatenáct osmdesát jedna
<img src="https://fr.wikipedia.org/wiki/Special:CentralAutoLogin/start?type=1x1" alt="" title="" width="1" height="1" style="border: none; position: absolute;">