Pseudo-reverzní

V matematice a přesněji v lineární algebře pojem pseudo-inverze (nebo generalizované inverze ) zobecňuje pojem inverze lineární mapy nebo matice na nezvratné případy odstraněním některých vlastností požadovaných od inverzí, nebo rozšířením do větších nealgebraických prostorů.

Obecně neexistuje žádná jedinečnost pseudo-inverze. Její existence, pro lineární mapu mezi prostory s případně nekonečného rozměru , je ekvivalentní k existenci doplňkových prvků z jádra a obrazu. Podle požadovaných vlastností definovaná pseudo-inverze přesto umožňuje zobecnit pojem inverze tím, že se omezí pouze na multiplikativní asociativní poloskupinu samotnou, i když nerespektuje ostatní omezení pole nebo algebry ( zejména vlastnosti distributivity nebo komutativity již neplatí v obecném případě, kde je může respektovat skutečná inverze).

Byly studovány zejména následující typy pseudoinverzí:

Moore-Penroseova pseudo-inverze v případě neinvertovatelných čtvercových matic, ale zobecnitelná na jakoukoli algebru matic s hodnotami v poli.
pseudo inverze Drazina, která určuje matici, která představuje pevný bod v násobení exponenciací čtvercových matic nad konečný stupeň.
pseudo-inverze vlevo a pseudo-inverze vpravo, užitečné v případě ne-čtvercových matic, které nikdy nejsou invertovatelné pro určení faktorizace v singulárních hodnotách a které se nemusí nutně rovnat ani v případě ne- transformuje komutativní jako funkční operátory a diskrétní distribuce.

Pseudo-inverze se vypočítá pomocí zevšeobecnění spektrální věty na jiné než čtvercové matice.

To je zvláště užitečné při výpočtu regresí (metoda nejmenších čtverců) pro systém lineárních rovnic.

Moore-Penroseova pseudo-inverze

Pro matici se skutečnými nebo složitými koeficienty (ne nutně čtvercovými ) nebo pro lineární aplikaci mezi euklidovskými nebo hermitskými prostory existuje jedinečná pseudo-inverze, která splňuje určité další podmínky, a nazývá se Moore-Penroseova pseudo-inverze (nebo jednoduše „pseudo - inverzní-inverzní “), který popsal Eliakim Hastings Moore již v roce 1920 a nezávisle znovuobjevil Roger Penrose v roce 1955. Erik Ivar Fredholm již v roce 1903 představil koncept pseudo-inverze pro integrální operátor .

Obecný případ pro lineární aplikaci

Definice a první vlastnosti

Nechť lineární mapa mezi dvěma vektorovými prostory a a lineární mapy v . Tyto dvě aplikace jsou vzájemně pseudoinverzní, pokud jsou splněny následující dvě podmínky: $F$ $E$ $F$ $G$ $F$ $E$

{\ displaystyle f \ circ g \ circ f = f}

a .

{\ displaystyle g \ circ f \ circ g = g}

V tomto případě jsou zkontrolovány následující vlastnosti:

prostor je přímým součtem jádra a obrazu ; $E$ $F$ $G$
prostor je přímý součet jádra a obrazu ; $F$ $G$ $F$
aplikace a indukují vzájemné izomorfismy mezi jejich obrazy; $F$ $G$
pokud je aplikace invertibilní, pak je její inverzní aplikace . $F$ $G$

Tato definice se přirozeně překládá v maticové formě v případě konečných dimenzionálních vektorových prostorů.

Existence a konstrukce

Naopak, nechť je lineární mapa mezi dvěma vektorovými prostory a jehož jádro připouští další v a jehož obrázek připouští další v . Pak omezení na indukuje izomorfismus mezi a jeho obrazu. Převrácená mapa šnekového obrázku jednoznačně prodlužuje o null map na , do lineárního mapy města v nichž je podle konstrukce pseudo-inverzní . $F$ $E$ $F$ $K.$ $E$ $NE$ $F$ $F$ $K.$ $K.$ $F$ $K.$ $NE$ $G$ $F$ $E$ $F$

Existuje proto vzájemná korespondence mezi pseudoinverzemi lineární mapy a dalšími páry pro její jádro a jeho obraz.

Poznámka: toto samozřejmě platí pro případy, kdy jeden z přídavných a je redukován na počátek nebo na celý vektorový prostor, ke kterému dochází zejména, když je invertible: je pak roven a je redukován na l 'počátek. $K.$ $NE$ $F$ $K.$ $E$ $NE$

Výběr dalších

Obecně neexistuje žádná kanonická volba doplňku, ale euklidovská nebo hermitovská prostorová struktura nad zdrojovým a cílovým vektorovým prostorem umožňuje určit jeden podle definice ortogonálního . Tato definice pseudo-inverze odpovídá „Moore-Penroseově pseudo-inverzi“ pro matice.

Maticový případ

Definice

Vzhledem k matici se skutečnými nebo složitými koeficienty s řádky a sloupci je její pseudoinverze jedinou maticí s řádky a sloupci, které splňují následující podmínky: $NA$ $ne$ $p$ $A ^ {+}$ $p$ $ne$

$AA ^ {+} A = A \,$ ;
$A ^ {+} AA ^ {+} = A ^ {+} \,$ ( je inverzní pro multiplikativní poloskupinu); $A ^ {+}$
${\ displaystyle (AA ^ {+}) ^ {*} = AA ^ {+} \,}$ ( je hermitovská matice); ${\ displaystyle AA ^ {+}}$
${\ displaystyle (A ^ {+} A) ^ {*} = A ^ {+} A \,}$ ( je také Hermitian). ${\ displaystyle A ^ {+} A}$

Zde se notace označuje matice připojena na , to znamená na transpozici pro reálnou případu. ${\ displaystyle M ^ {*} \}$ ${\ displaystyle M \}$

Tuto matici lze získat jako limit :

{\ displaystyle A ^ {+} = \ lim _ {\ delta \ to 0} (A ^ {*} A + \ delta I) ^ {- 1} A ^ {*} = \ lim _ {\ delta \ to 0} A ^ {*} (AA ^ {*} + \ delta I) ^ {- 1}}

který existuje, i když matice produktu ( ) a ( ) nejsou invertovatelné. ${\ displaystyle AA ^ {*}}$ ${\ displaystyle A ^ {*} A}$

Vlastnosti

{\ displaystyle {\ begin {aligned} (A ^ {+}) ^ {+} & = A \\ ({} ^ {t} \! A) ^ {+} & = {} ^ {t} \! (A ^ {+}) \\ ({\ overline {A}}) ^ {+} & = {\ overline {A ^ {+}}} \\ (A ^ {*}) ^ {+} & = (A ^ {+}) ^ {*} \\\ konec {zarovnáno}}}

Identity platné pro jakoukoli matici (se skutečnými nebo komplexními koeficienty) $NA$

Operace pseudo inverze:

je involutivní ;
přepínače s transpozicí a konjugací ;

Pseudoinverze však není spojitá . Ve skutečnosti je nepřímo lineární ve srovnání s násobením skalárem: pro všechny ≠ 0, $\ alfa$

{\ displaystyle (\ alpha A) ^ {+} = {\ frac {1} {\ alpha}} A ^ {+} \}

Let je součin dvou matic. Pokud je alespoň jedna unitární , nebo pokud jsou dvě matice s maximálním hodnocením rovným jejich společné dimenzi, pak je pseudoinverze na produktu antikomutativní: $AB$

{\ displaystyle (AB) ^ {+} = B ^ {+} A ^ {+} \}

.Projekce

Pokud a jsou ortogonální projektory , nechť jsou hermitovské ( , ) a idempotentní ( a ) matice , máme následující výsledky: ${\ displaystyle P = AA ^ {+} \, \!}$ ${\ displaystyle Q = A ^ {+} A \, \!}$ ${\ displaystyle P = P ^ {*} \, \!}$ ${\ displaystyle Q = Q ^ {*} \, \!}$ ${\ displaystyle P ^ {2} = P \, \!}$ ${\ displaystyle Q ^ {2} = Q \, \!}$

${\ displaystyle PA = A = AQ \, \!}$ a ${\ displaystyle A ^ {+} P = A ^ {+} = QA ^ {+} \, \!}$
$P \, \!$ je ortogonální projektor na snímku z (ekvivalent k ortogonální doplněk jader ). $NA\,\!$ ${\ displaystyle A ^ {*} \, \!}$
${\ displaystyle Q \, \!}$ je ortogonální projektor na obraz (ekvivalent ortogonálního doplňku jádra ). ${\ displaystyle A ^ {*} \, \!}$ ${\ displaystyle A \, \!}$
${\ displaystyle (IP) \, \!}$ je ortogonální projektor na jádro z . ${\ displaystyle A ^ {*} \, \!}$
${\ displaystyle (IQ) \, \!}$ je ortogonální projektor na jádru . $NA\,\!$

Efektivní výpočet

Pokud má matice s řádky a sloupci hodnost , lze ji zapsat jako součin matic stejné hodnosti , kde má řádky a sloupce a má řádky a sloupce. V tomto případě jsou produkty ( ) a ( ) invertibilní a je ověřen následující vztah: $NA$ $ne$ $p$ $k$ $A = BC$ $B$ $ne$ $k$ $VS$ $k$ $p$ ${\ displaystyle CC ^ {*}}$ ${\ displaystyle B ^ {*} B}$

{\ displaystyle A ^ {+} = C ^ {*} (CC ^ {*}) ^ {- 1} (B ^ {*} B) ^ {- 1} B ^ {*} \,}

Optimalizované přístupy existují pro výpočet pseudoinverzí blokových matic.

Algoritmicky se pseudo-inverze získá z rozkladu na singulární hodnoty : s tímto rozkladem vypočítáme ${\ displaystyle A = U \ sigma V ^ {*}}$

{\ displaystyle A ^ {+} = V \ sigma ^ {+} U ^ {*}}

kde , pseudo-inverze diagonální matice , je diagonální matice, jejíž nenulové prvky se získají převrácením nenulových prvků (úhlopříčky) z . ${\ displaystyle \ sigma ^ {+}}$ $\ sigma$ $\ sigma$

Z matice, jejíž pseudo-inverze je známa, existují specializované algoritmy, které provádějí výpočet rychleji pro matice související s první. Zejména pokud je rozdíl změněn, odstraněn nebo přidán pouze jeden řádek nebo sloupec, mohou tento vztah využít iterační algoritmy.

Speciální případy

{\ displaystyle X ^ {+} = \ left \ {{\ begin {array} {rl} 0 & {\ mbox {si}} \ X = 0; \\ {\ frac {1} {\ left \ Vert X \ right \ Vert ^ {2}}} X ^ {*} & {\ mbox {jinak}}. \\\ end {array}} \ right.}

Pseudo-inverze vektoru sloupce

Pseudo-inverze nulové matice je její transpozice (také nulová).
Pseudo-inverze nenulového sloupcového vektoru je jeho adjunkční vektor vynásobený inverzí jeho čtvercové normy. Zejména pseudo-inverze skutečného nebo komplexního nenulového skaláru (matice s 1 řádkem a 1 sloupcem) je jeho inverzní.
Pokud je hodnost rovna jejímu počtu řádků, lze vybrat matici rovnou identitě, v tomto případě: $NA$ $B$ ${\ displaystyle A ^ {+} = A ^ {*} (AA ^ {*}) ^ {- 1} \,}$ .
Podobně, pokud je pořadí stejné jako jeho počet sloupců, $NA$ ${\ displaystyle A ^ {+} = (A ^ {*} A) ^ {- 1} A ^ {*} \,}$ .
A fortiori pokud je matice invertibilní, její pseudo-inverze je její inverze. $NA$
Pokud je známa pseudo-inverze ( ), můžeme z ní odvodit rovnost: ${\ displaystyle A ^ {*} A}$ $A ^ {+}$ ${\ displaystyle A ^ {+} = (A ^ {*} A) ^ {+} A ^ {*} \,}$ ;
Podobně, je-li známo, je pseudo-inverze dána vztahem: ${\ displaystyle (AA ^ {*}) ^ {+}}$ $NA$ ${\ displaystyle A ^ {+} = A ^ {*} (AA ^ {*}) ^ {+} \,}$ ;

Příklad použití

Pseudoinverze poskytuje řešení systému lineárních rovnic, ekvivalentní tomu, který by poskytla metoda nejmenších čtverců .

Uvažujme systém , hledáme vektoru , který minimalizuje , kde jsme si poznamenali v euklidovské normy . ${\ displaystyle Ax = b}$ $X$ ${\ displaystyle \ | Ax-b \ | ^ {2}}$ ${\ displaystyle \ | \, \ cdot \, \ |}$

Obecné řešení lineárního systému je součtem konkrétního řešení a obecného řešení homogenní rovnice . ${\ displaystyle Ax = b}$ ${\ displaystyle Ax = 0}$

Lemma: Pokud existuje, pak lze řešení vždy zapsat jako součet pseudoinverzí řešení systému a řešení homogenního systému: ${\ displaystyle (AA ^ {*}) ^ {- 1}}$ $X$

{\ displaystyle x = A ^ {*} (AA ^ {*}) ^ {- 1} b + (IA ^ {*} (AA ^ {*}) ^ {- 1} A) y. \,}

Důkaz . ∎ ${\ displaystyle Ax = AA ^ {*} (AA ^ {*}) ^ {- 1} b + Ay-AA ^ {*} (AA ^ {*}) ^ {- 1} Ay = b + Ay-Ay = b}$

Zde je vektor libovolný (pokud ne jeho dimenze). K pseudo-inverzi dochází dvakrát: pokud ji napíšeme , dostaneme $y$ ${\ displaystyle A ^ {*} (AA ^ {*}) ^ {- 1}}$ ${\ displaystyle A ^ {+} \}$

{\ displaystyle x = A ^ {+} b + (IA ^ {+} A) y. \}

První člen součtu je pseudo-inverzní řešení. V přístupu nejmenších čtverců je to nejlepší lineární aproximace řešení. To znamená, že druhý člen součtu má minimální standard.

Tento druhý člen představuje řešení homogenního systému , protože je to ortogonální projekce na jádru , zatímco je ortogonální projekce na obraze . ${\ displaystyle Ax = 0 \}$ ${\ displaystyle (IA ^ {+} A) \}$ ${\ displaystyle A \}$ ${\ displaystyle (A ^ {+} A) = A ^ {*} (AA ^ {*}) ^ {- 1} A \}$ $A ^ {*}$

Poznámky a odkazy

Poznámky

(en) Adi Ben-Israel a Thomas NE Greville , Generalized Inverses: Theory and Applications , Springer-Verlag,2003, 2 nd ed. ( 1 st ed. 1974) ( ISBN 0-387-00293-6 )
(in) E. H. Moore , „ je převrácená hodnota obecné algebraické matice “ , Bull. AMS , sv. 26,1920, str. 394-395 ( číst online , konzultováno 19. prosince 2010 )
(in) Roger Penrose , „ Zobecněná inverze pro matice “ , Proceedings of the Cambridge Philosophical Society , sv. 51,1955, str. 406-413
(in) Gene H. Golub , Charles F. Van Loan , maticové výpočty , Baltimore / London, Johns Hopkins,1996, 3 e ed. , 257–258 s. ( ISBN 0-8018-5414-8 )
(in) Roger Penrose , „ je nejlepší přibližné řešení rovnic lineární matice “ , Proceedings of the Cambridge Philosophical Society , sv. 52,1956, str. 17-19

Reference

( fr ) Tento článek je částečně nebo zcela převzat z článku Wikipedie v angličtině s názvem „ Pseudoinverse “ ( viz seznam autorů ) .
(de) W. Mackens, H. Voß: „Mathematik I für Studierende der Ingenieurwissenschaften“
(de) A. Kielbasinski, H. Schwetlick: „Numerische lineare Algebra“ , Deutscher Verlag der Wissenschaften , 1988

Podívejte se také

externí odkazy

(en) Pseudoinverze na planetmath.org
(en) Eric W. Weisstein , „ Pseudoinverse “ , na MathWorld
(en) Eric W. Weisstein , „ Moore-Penrose Matrix Inverse “ , na MathWorld
(en) Lineární a pseudo-inverzní systémy