Pseudo-reverzní
V matematice a přesněji v lineární algebře pojem pseudo-inverze (nebo generalizované inverze ) zobecňuje pojem inverze lineární mapy nebo matice na nezvratné případy odstraněním některých vlastností požadovaných od inverzí, nebo rozšířením do větších nealgebraických prostorů.
Obecně neexistuje žádná jedinečnost pseudo-inverze. Její existence, pro lineární mapu mezi prostory s případně nekonečného rozměru , je ekvivalentní k existenci doplňkových prvků z jádra a obrazu. Podle požadovaných vlastností definovaná pseudo-inverze přesto umožňuje zobecnit pojem inverze tím, že se omezí pouze na multiplikativní asociativní poloskupinu samotnou, i když nerespektuje ostatní omezení pole nebo algebry ( zejména vlastnosti distributivity nebo komutativity již neplatí v obecném případě, kde je může respektovat skutečná inverze).
Byly studovány zejména následující typy pseudoinverzí:
- Moore-Penroseova pseudo-inverze v případě neinvertovatelných čtvercových matic, ale zobecnitelná na jakoukoli algebru matic s hodnotami v poli.
- pseudo inverze Drazina, která určuje matici, která představuje pevný bod v násobení exponenciací čtvercových matic nad konečný stupeň.
- pseudo-inverze vlevo a pseudo-inverze vpravo, užitečné v případě ne-čtvercových matic, které nikdy nejsou invertovatelné pro určení faktorizace v singulárních hodnotách a které se nemusí nutně rovnat ani v případě ne- transformuje komutativní jako funkční operátory a diskrétní distribuce.
Pseudo-inverze se vypočítá pomocí zevšeobecnění spektrální věty na jiné než čtvercové matice.
To je zvláště užitečné při výpočtu regresí (metoda nejmenších čtverců) pro systém lineárních rovnic.
Moore-Penroseova pseudo-inverze
Pro matici se skutečnými nebo složitými koeficienty (ne nutně čtvercovými ) nebo pro lineární aplikaci mezi euklidovskými nebo hermitskými prostory existuje jedinečná pseudo-inverze, která splňuje určité další podmínky, a nazývá se Moore-Penroseova pseudo-inverze (nebo jednoduše „pseudo - inverzní-inverzní “), který popsal Eliakim Hastings Moore již v roce 1920 a nezávisle znovuobjevil Roger Penrose v roce 1955. Erik Ivar Fredholm již v roce 1903 představil koncept pseudo-inverze pro integrální operátor .
Obecný případ pro lineární aplikaci
Definice a první vlastnosti
Nechť lineární mapa mezi dvěma vektorovými prostory a a lineární mapy v . Tyto dvě aplikace jsou vzájemně pseudoinverzní, pokud jsou splněny následující dvě podmínky:
F{\ displaystyle f} E{\ displaystyle E}F{\ displaystyle F}G{\ displaystyle g}F{\ displaystyle F}E{\ displaystyle E}
F∘G∘F=F{\ displaystyle f \ circ g \ circ f = f}a .
G∘F∘G=G{\ displaystyle g \ circ f \ circ g = g}
V tomto případě jsou zkontrolovány následující vlastnosti:
- prostor je přímým součtem jádra a obrazu ;E{\ displaystyle E}F{\ displaystyle f}G{\ displaystyle g}
- prostor je přímý součet jádra a obrazu ;F{\ displaystyle F}G{\ displaystyle g}F{\ displaystyle f}
- aplikace a indukují vzájemné izomorfismy mezi jejich obrazy;F{\ displaystyle f}G{\ displaystyle g}
- pokud je aplikace invertibilní, pak je její inverzní aplikace .F{\ displaystyle f}G{\ displaystyle g}
Tato definice se přirozeně překládá v maticové formě v případě konečných dimenzionálních vektorových prostorů.
Existence a konstrukce
Naopak, nechť je lineární mapa mezi dvěma vektorovými prostory a jehož jádro připouští další v a jehož obrázek připouští další v . Pak omezení na indukuje izomorfismus mezi a jeho obrazu. Převrácená mapa šnekového obrázku jednoznačně prodlužuje o null map na , do lineárního mapy města v nichž je podle konstrukce pseudo-inverzní .
F{\ displaystyle f}E{\ displaystyle E}F{\ displaystyle F}K.{\ displaystyle K}E{\ displaystyle E}NE{\ displaystyle N}F{\ displaystyle F}F{\ displaystyle f}K.{\ displaystyle K}K.{\ displaystyle K}F{\ displaystyle f}K.{\ displaystyle K}NE{\ displaystyle N}G{\ displaystyle g}F{\ displaystyle F}E{\ displaystyle E}F{\ displaystyle f}
Existuje proto vzájemná korespondence mezi pseudoinverzemi lineární mapy a dalšími páry pro její jádro a jeho obraz.
Poznámka: toto samozřejmě platí pro případy, kdy jeden z přídavných a je redukován na počátek nebo na celý vektorový prostor, ke kterému dochází zejména, když je invertible: je pak roven a je redukován na l 'počátek.
K.{\ displaystyle K}NE{\ displaystyle N}F{\ displaystyle f}K.{\ displaystyle K}E{\ displaystyle E}NE{\ displaystyle N}
Výběr dalších
Obecně neexistuje žádná kanonická volba doplňku, ale euklidovská nebo hermitovská prostorová struktura nad zdrojovým a cílovým vektorovým prostorem umožňuje určit jeden podle definice ortogonálního . Tato definice pseudo-inverze odpovídá „Moore-Penroseově pseudo-inverzi“ pro matice.
Maticový případ
Definice
Vzhledem k matici se skutečnými nebo složitými koeficienty s řádky a sloupci je její pseudoinverze jedinou maticí s řádky a sloupci, které splňují následující podmínky:
NA{\ displaystyle A}ne{\ displaystyle n}p{\ displaystyle p}NA+{\ displaystyle A ^ {+}}p{\ displaystyle p}ne{\ displaystyle n}
-
NANA+NA=NA{\ displaystyle AA ^ {+} A = A \,} ;
-
NA+NANA+=NA+{\ displaystyle A ^ {+} AA ^ {+} = A ^ {+} \,} ( je inverzní pro multiplikativní poloskupinu);NA+{\ displaystyle A ^ {+}}
-
(NANA+)∗=NANA+{\ displaystyle (AA ^ {+}) ^ {*} = AA ^ {+} \,} ( je hermitovská matice);NANA+{\ displaystyle AA ^ {+}}
-
(NA+NA)∗=NA+NA{\ displaystyle (A ^ {+} A) ^ {*} = A ^ {+} A \,} ( je také Hermitian).NA+NA{\ displaystyle A ^ {+} A}
Zde se notace označuje matice připojena na , to znamená na transpozici pro reálnou případu.
M∗ {\ displaystyle M ^ {*} \}M {\ displaystyle M \}
Tuto matici lze získat jako limit :
NA+=limδ→0(NA∗NA+δJá)-1NA∗=limδ→0NA∗(NANA∗+δJá)-1{\ displaystyle A ^ {+} = \ lim _ {\ delta \ to 0} (A ^ {*} A + \ delta I) ^ {- 1} A ^ {*} = \ lim _ {\ delta \ to 0} A ^ {*} (AA ^ {*} + \ delta I) ^ {- 1}}který existuje, i když matice produktu ( ) a ( ) nejsou invertovatelné.
NANA∗{\ displaystyle AA ^ {*}}NA∗NA{\ displaystyle A ^ {*} A}
Vlastnosti
(NA+)+=NA(tNA)+=t(NA+)(NA¯)+=NA+¯(NA∗)+=(NA+)∗{\ displaystyle {\ begin {aligned} (A ^ {+}) ^ {+} & = A \\ ({} ^ {t} \! A) ^ {+} & = {} ^ {t} \! (A ^ {+}) \\ ({\ overline {A}}) ^ {+} & = {\ overline {A ^ {+}}} \\ (A ^ {*}) ^ {+} & = (A ^ {+}) ^ {*} \\\ konec {zarovnáno}}}
Identity platné pro jakoukoli matici (se skutečnými nebo komplexními koeficienty)NA{\ displaystyle A}
Operace pseudo inverze:
Pseudoinverze však není spojitá . Ve skutečnosti je nepřímo lineární ve srovnání s násobením skalárem: pro všechny ≠ 0,
α{\ displaystyle \ alpha}
(αNA)+=1αNA+ {\ displaystyle (\ alpha A) ^ {+} = {\ frac {1} {\ alpha}} A ^ {+} \}.
Let je součin dvou matic. Pokud je alespoň jedna unitární , nebo pokud jsou dvě matice s maximálním hodnocením rovným jejich společné dimenzi, pak je pseudoinverze na produktu antikomutativní:
NAB{\ displaystyle AB}
(NAB)+=B+NA+ {\ displaystyle (AB) ^ {+} = B ^ {+} A ^ {+} \}.
Projekce
Pokud a jsou ortogonální projektory , nechť jsou hermitovské ( , ) a idempotentní ( a ) matice , máme následující výsledky:
P=NANA+{\ displaystyle P = AA ^ {+} \, \!}Q=NA+NA{\ displaystyle Q = A ^ {+} A \, \!}P=P∗{\ displaystyle P = P ^ {*} \, \!}Q=Q∗{\ displaystyle Q = Q ^ {*} \, \!}P2=P{\ displaystyle P ^ {2} = P \, \!}Q2=Q{\ displaystyle Q ^ {2} = Q \, \!}
-
PNA=NA=NAQ{\ displaystyle PA = A = AQ \, \!} a NA+P=NA+=QNA+{\ displaystyle A ^ {+} P = A ^ {+} = QA ^ {+} \, \!}
-
P{\ displaystyle P \, \!}je ortogonální projektor na snímku z (ekvivalent k ortogonální doplněk jader ).NA{\ displaystyle A \, \!}NA∗{\ displaystyle A ^ {*} \, \!}
-
Q{\ displaystyle Q \, \!}je ortogonální projektor na obraz (ekvivalent ortogonálního doplňku jádra ).NA∗{\ displaystyle A ^ {*} \, \!}NA{\ displaystyle A \, \!}
-
(Já-P){\ displaystyle (IP) \, \!}je ortogonální projektor na jádro z .NA∗{\ displaystyle A ^ {*} \, \!}
-
(Já-Q){\ displaystyle (IQ) \, \!}je ortogonální projektor na jádru .NA{\ displaystyle A \, \!}
Efektivní výpočet
Pokud má matice s řádky a sloupci hodnost , lze ji zapsat jako součin matic stejné hodnosti , kde má řádky a sloupce a má řádky a sloupce. V tomto případě jsou produkty ( ) a ( ) invertibilní a je ověřen následující vztah:
NA{\ displaystyle A}ne{\ displaystyle n}p{\ displaystyle p} k{\ displaystyle k}NA=BVS{\ displaystyle A = BC}B{\ displaystyle B}ne{\ displaystyle n}k{\ displaystyle k}VS{\ displaystyle C}k{\ displaystyle k}p{\ displaystyle p}VSVS∗{\ displaystyle CC ^ {*}}B∗B{\ displaystyle B ^ {*} B}
NA+=VS∗(VSVS∗)-1(B∗B)-1B∗{\ displaystyle A ^ {+} = C ^ {*} (CC ^ {*}) ^ {- 1} (B ^ {*} B) ^ {- 1} B ^ {*} \,}.
Optimalizované přístupy existují pro výpočet pseudoinverzí blokových matic.
Algoritmicky se pseudo-inverze získá z rozkladu na singulární hodnoty : s tímto rozkladem vypočítáme
NA=UσPROTI∗{\ displaystyle A = U \ sigma V ^ {*}}
NA+=PROTIσ+U∗{\ displaystyle A ^ {+} = V \ sigma ^ {+} U ^ {*}},
kde , pseudo-inverze diagonální matice , je diagonální matice, jejíž nenulové prvky se získají převrácením nenulových prvků (úhlopříčky) z .
σ+{\ displaystyle \ sigma ^ {+}} σ{\ displaystyle \ sigma}σ{\ displaystyle \ sigma}
Z matice, jejíž pseudo-inverze je známa, existují specializované algoritmy, které provádějí výpočet rychleji pro matice související s první. Zejména pokud je rozdíl změněn, odstraněn nebo přidán pouze jeden řádek nebo sloupec, mohou tento vztah využít iterační algoritmy.
Speciální případy
X+={0-li X=0;1‖X‖2X∗Pokud ne.{\ displaystyle X ^ {+} = \ left \ {{\ begin {array} {rl} 0 & {\ mbox {si}} \ X = 0; \\ {\ frac {1} {\ left \ Vert X \ right \ Vert ^ {2}}} X ^ {*} & {\ mbox {jinak}}. \\\ end {array}} \ right.}
Pseudo-inverze vektoru sloupce
- Pseudo-inverze nulové matice je její transpozice (také nulová).
- Pseudo-inverze nenulového sloupcového vektoru je jeho adjunkční vektor vynásobený inverzí jeho čtvercové normy. Zejména pseudo-inverze skutečného nebo komplexního nenulového skaláru (matice s 1 řádkem a 1 sloupcem) je jeho inverzní.
- Pokud je hodnost rovna jejímu počtu řádků, lze vybrat matici rovnou identitě, v tomto případě:
NA{\ displaystyle A}B{\ displaystyle B}
NA+=NA∗(NANA∗)-1{\ displaystyle A ^ {+} = A ^ {*} (AA ^ {*}) ^ {- 1} \,}.
- Podobně, pokud je pořadí stejné jako jeho počet sloupců,
NA{\ displaystyle A}
NA+=(NA∗NA)-1NA∗{\ displaystyle A ^ {+} = (A ^ {*} A) ^ {- 1} A ^ {*} \,}.
-
A fortiori pokud je matice invertibilní, její pseudo-inverze je její inverze.NA{\ displaystyle A}
- Pokud je známa pseudo-inverze ( ), můžeme z ní odvodit rovnost:
NA∗NA{\ displaystyle A ^ {*} A}NA+{\ displaystyle A ^ {+}}
NA+=(NA∗NA)+NA∗{\ displaystyle A ^ {+} = (A ^ {*} A) ^ {+} A ^ {*} \,} ;
- Podobně, je-li známo, je pseudo-inverze dána vztahem:
(NANA∗)+{\ displaystyle (AA ^ {*}) ^ {+}}NA{\ displaystyle A}
NA+=NA∗(NANA∗)+{\ displaystyle A ^ {+} = A ^ {*} (AA ^ {*}) ^ {+} \,};
Příklad použití
Pseudoinverze poskytuje řešení systému lineárních rovnic, ekvivalentní tomu, který by poskytla metoda nejmenších čtverců .
Uvažujme systém , hledáme vektoru , který minimalizuje , kde jsme si poznamenali v euklidovské normy .
NAX=b{\ displaystyle Ax = b}X{\ displaystyle x}‖NAX-b‖2{\ displaystyle \ | Ax-b \ | ^ {2}}‖⋅‖{\ displaystyle \ | \, \ cdot \, \ |}
Obecné řešení lineárního systému je součtem konkrétního řešení a obecného řešení homogenní rovnice .
NAX=b{\ displaystyle Ax = b}NAX=0{\ displaystyle Ax = 0}
Lemma: Pokud existuje, pak lze řešení vždy zapsat jako součet pseudoinverzí řešení systému a řešení homogenního systému:
(NANA∗)-1{\ displaystyle (AA ^ {*}) ^ {- 1}}X{\ displaystyle x}
X=NA∗(NANA∗)-1b+(Já-NA∗(NANA∗)-1NA)y.{\ displaystyle x = A ^ {*} (AA ^ {*}) ^ {- 1} b + (IA ^ {*} (AA ^ {*}) ^ {- 1} A) y. \,}Důkaz . ∎NAX=NANA∗(NANA∗)-1b+NAy-NANA∗(NANA∗)-1NAy=b+NAy-NAy=b{\ displaystyle Ax = AA ^ {*} (AA ^ {*}) ^ {- 1} b + Ay-AA ^ {*} (AA ^ {*}) ^ {- 1} Ay = b + Ay-Ay = b}
Zde je vektor libovolný (pokud ne jeho dimenze). K pseudo-inverzi
dochází dvakrát: pokud ji napíšeme , dostaneme
y{\ displaystyle}NA∗(NANA∗)-1{\ displaystyle A ^ {*} (AA ^ {*}) ^ {- 1}}NA+ {\ displaystyle A ^ {+} \}
X=NA+b+(Já-NA+NA)y. {\ displaystyle x = A ^ {+} b + (IA ^ {+} A) y. \}První člen součtu je pseudo-inverzní řešení. V přístupu nejmenších čtverců je to nejlepší lineární aproximace řešení. To znamená, že druhý člen součtu má minimální standard.
Tento druhý člen představuje řešení homogenního systému , protože je to ortogonální projekce na jádru , zatímco je ortogonální projekce na obraze .
NAX=0 {\ displaystyle Ax = 0 \}(Já-NA+NA) {\ displaystyle (IA ^ {+} A) \}NA {\ displaystyle A \}(NA+NA)=NA∗(NANA∗)-1NA {\ displaystyle (A ^ {+} A) = A ^ {*} (AA ^ {*}) ^ {- 1} A \}NA∗{\ displaystyle A ^ {*}}
Poznámky a odkazy
Poznámky
-
(en) Adi Ben-Israel a Thomas NE Greville , Generalized Inverses: Theory and Applications , Springer-Verlag,2003, 2 nd ed. ( 1 st ed. 1974) ( ISBN 0-387-00293-6 )
-
(in) E. H. Moore , „ je převrácená hodnota obecné algebraické matice “ , Bull. AMS , sv. 26,1920, str. 394-395 ( číst online , konzultováno 19. prosince 2010 )
-
(in) Roger Penrose , „ Zobecněná inverze pro matice “ , Proceedings of the Cambridge Philosophical Society , sv. 51,1955, str. 406-413
-
(in) Gene H. Golub , Charles F. Van Loan , maticové výpočty , Baltimore / London, Johns Hopkins,1996, 3 e ed. , 257–258 s. ( ISBN 0-8018-5414-8 )
-
(in) Roger Penrose , „ je nejlepší přibližné řešení rovnic lineární matice “ , Proceedings of the Cambridge Philosophical Society , sv. 52,1956, str. 17-19
Reference
Podívejte se také
externí odkazy
Související články