Prokustova analýza

Ve statistikách je procustova analýza technikou pro porovnávání tvarů . Používá se pro deformaci objektu v, aby bylo co nejvíce podobné referenční (potenciálně nežádoucího), přičemž mezi objektem a reference pouze rozdíly, že oprávnění transformace ( rotace , překlady a resetování). Scale ) nemohl vymazat. Deformace odstraní rozdíly, které nejsou způsobeny vnitřním tvarem objektu (ale například předpětím zavedeným během získávání dat). Ty, které zůstanou, jsou považovány za objektivní a umožňují vyhodnotit stupeň podobnosti mezi objektem a odkazem.

Tuto techniku ​​pojmenovali v roce 1962 Hurley a Catell ze společnosti Procrustes , zbojník řecké mytologie, kteří přinutili své oběti lehnout si na postel a silou změnili jejich velikost tak, aby odpovídala velikosti postele. Teoretické jádro této techniky je však o více než 20 let dříve (Mosier, 1939). Procusteanova analýza, vylepšená a zdokonalená mnoha vědeckými publikacemi, se používá ve všech oblastech, kde může být užitečná analýza forem, mimo jiné v biologii , psychologii, archeologii a medicíně .

Problém Procrustes

Procrustes, postava z řecké mytologie , byl zloděj, který přinutil své oběti, aby si lehly na postel, a protáhl si nohy, pokud se jejich nohy nedotýkaly konce postele, nebo naopak jim sekají nohy, pokud vyčnívají z postele.

Vědecká verze příběhu, v oblasti analýzy forem, spočívá v tom, že se za postel vezme referenční forma, jejíž vlastnosti jsou známé, na kterou budeme položit oběti pocházející ze souboru předmětů ke studiu. Problém je v porovnání tvaru postele s tvarem obětí, což je obtížná operace, pokud jeden nemůže ležet na druhém.

K změně velikosti obětí a vyřešení problému vědci použijí ve skutečnosti sekeru překlad, který umožní přesunout oběti do středu postele, homothety , což změní velikost oběti tak, že se rovná velikosti postele a nakonec rotaci, která najde nejpohodlnější polohu pro oběť.

Ukazuje se tedy, že sekera nemůže změnit tvar objektu (všechny použité transformace udržují úhly). To umožňuje například v biologii porovnat tvar lebky delfína a krysy, čímž se eliminuje rozdíl ve velikosti mezi těmito dvěma lebkami, stejně jako rozdíly zavedené během digitalizace dat (poloha a orientace na měřicím zařízení , například).

Dvourozměrné ilustrace

Prvním krokem v Procrusteanově analýze je hledat ve tvaru, který má být studován, určitý počet bodů považovaných za referenční body nebo body zájmu, které budou schopny shrnout studovaný tvar. Pro ilustraci řešení problému Prokrustů můžeme uvažovat o případu oběti, symbolizované čtyřmi body zeleného čtyřúhelníku na diagramu, který se snaží položit na čtvercovou postel (na diagramu modře), boční 1, se středem na počátek.

Základní metoda, která je zde znázorněna, spočívá v odstranění tří složek v translaci, rotaci a měřítku ze zeleného čtyřúhelníku. Jediným omezením v pořadí operací je, že rotace musí být provedena jako poslední.

Odebrání komponenty v překladu

Tvar, který se má analyzovat, a reference jsou nyní soustředěny na počátek.

Centrum v čtyřúhelníku uvažovaného se musí shodovat se středem referenčního tvaru, který je umístěn na počátku referenčního framu. Chcete-li to provést, stačí vypočítat souřadnice středu zeleného čtyřúhelníku:

kde jsou souřadnice čtyř vrcholů zeleného čtyřúhelníku, pak platí pro všechny tyto body transformace  :

Demontáž součásti váhy

Velikost oběti lze vypočítat různými způsoby (závisí hlavně na zvolené metrice ). Zvažte zde jeden z nejpoužívanějších, kde velikost čtyřúhelníku, který má být analyzován, je:

To má dát uvažovanému tvaru stejnou velikost jako referenčnímu tvaru. Protože toto je 1, stačí použít transformaci na všechny body tvaru.

Demontáž rotující součásti

Poslední krok, nejsložitější, spočívá ve zjištění, z jakého úhlu otočit zelený čtyřúhelník, aby se co nejlépe rozdělilo mezi čtyři body, které tvoří tvary, rozdíl, který představuje s referenčním tvarem.

Matematicky je tento rozdíl vyjádřen vzdáleností (která stejně jako oblast závisí na zvolené metrice), která je minimalizována jako funkce , například metodou nejmenších čtverců .

Tato vzdálenost, jakmile je minimalizována, se nazývá prokrustovská vzdálenost a je zajímavá pouze ve srovnání s prokrustskou vzdáleností jiných vzorků. Například v biologii umožňuje srovnání tvarů lebek vyhodnotit vzdálenost mezi několika druhy.

Matematický formalismus

Geometrický formalismus

Předmětem analýzy je forma , složená z bodů zájmu o rozměru , který se budeme srovnávat s referencí .

Tvar je součástí třídy ekvivalence , generovaný odstraněním komponent překladu, rotace a měřítka.

Problém vyřešený procusteanskou analýzou je minimalizace vzdálenosti mezi a , pouze s použitím překladů, rotací a homothety . To znamená, že hledáme:

kde je soubor skladeb překladů, rotací a homothety (pohyby, které Prokrustes může provádět se svou sekerou) a norma odpovídající zvolené vzdálenosti, velmi často definovaná:

Maticový formalismus

Maticový formalismus je ve skutečnosti ten, který v literatuře převládá (geometrický formalismus má pouze pedagogický zájem).

Opětovným převzetím zápisů geometrického formalismu se problém Procrustes rovná úpravě matice dimenze (cestovatel), aby se minimalizovala její vzdálenost od Procrustesova lůžka , také dimenze , pomocí jiné matice , matice operací povolených v Procrustes , dimenze . To znamená, že budeme hledat:

Pokud je skutečné, řešení problému se odhaduje podle:

Vzdálenost od společnosti Procrustes

Procustova vzdálenost (nebo Procustova vzdálenost) je prostředek k porovnání dvou obrazů představovaných množinou bodů zájmu popsaných v Booksteinových souřadnicích . Používá se v rámci morfometrie .

Vzdálenost d mezi dvěma objekty s 1 a s 2 složenými z n bodů je dána vztahem:

.

Implementace

Matrice vyjádření problému pomohl computerize analýzy Procrustes, najdeme její zavedení v mnoha vědeckých softwaru, například Matlab , Octave nebo R .

Varianty

Procrusteanský problém, pokud stále odpovídá obecnému rámci, díky němuž objekt odpovídá jinému referenčnímu objektu, pomocí dobře definované sady transformace prvního objektu, zná nesčetné varianty:

  • je možné nastavit podmínky na matici (například podmínka ortogonality ), což znamená, že typ operací, které jsou možné na oběti, je omezený;
  • vyjádření vzdálenosti závisí na zvolené metrice;
  • uvažovaný objekt a referenci lze vytvořit z bodů umístěných v prostorech různých dimenzí (v takovém případě se velikost nejmenší matice zvětší přidáním 0 s).

Historický

Problém Procrustes tak pojmenovali Hurley a Catell v roce 1962, protože jejich program „je vhodný pro výkon nuceného přiřazování téměř jakýchkoli údajů téměř jakékoli hypotéze“. Mosier však v roce 1939, tedy před příchodem informačních technologií, dosáhl stejného řešení stejného problému. Studie, kterou provedl Cole v roce 1996, dokonce vysledovala první výskyt takového problému v publikaci z roku 1905, kterou napsal muž jménem Boas, a jeden z jejích studentů, Phelps, publikoval v roce 1932 rozšíření Boasovy metody s použitím střední hodnoty z několika vzorků, které tvoří jádro zobecněné Procusteanské analýzy , jejíž první výskyt pod tímto názvem pochází ze začátku 70. let.

Hustota literatury na toto téma, rozdílnost oblastí použití a množství problémů odvozených z původního problému Procrustes způsobily, že od konce šedesátých let bylo velmi obtížné vysledovat souvislý průběh problému, někteří objevy na toto téma někdy provádějí nezávisle dva lidé. V roce 1977 publikace deseti Berge identifikovala ne méně než 36 různých prokrustovských problémů.

Aplikační pole

Kvůli své užitečnosti při statistické analýze forem se Procustova analýza používá v medicíně, biologii, archeologii nebo dokonce ve fyzice (pro analýzu deformací).

Vývoj zobecněné analýzy Procrustes dále rozšířil spektrum aplikací, včetně například psychologie, kde je tato technika užitečná pro pochopení výsledků dotazníků s otevřeným profilem.

Dodatky

Poznámky

  1. „Je  možné brutálně využít všech dat k téměř jakékoli hypotéze  “, JR Hurley a RB Cattell, program The Procrustes: Produkce přímé rotace pro testování hypotetické struktury faktorů. Behav. Sci., 1962

Reference

  1. (in) „Shape Procrustes Distance Metric“ extrahuje práci provedenou na Katedře matematického modelování na Technické univerzitě v Dánsku
  2. (in) „Statistics Toolbox - Documentation“ Dokumentační funkce umožňuje použití statistického softwarového nástroje Matlab
  3. (in) „Rotace prokrustů  “ Analýza prokroků pro Octave a Matlab na osobní stránce Frans van den Berg na oficiálním webu Fakulty biologických věd Kodaňské univerzity
  4. (en) „Zobecněná analýza procrustů  “ procGPA Service Documentation software R

Bibliografie

(en) JC Gower a GB Dijksterhuis, Procrustes Problems , Oxford University Press ,2004

  1. str. 1
  2. str. 2
  3. str. 3
  4. p. 4

Ostatní:

  1. (in) LF Markus E. Hingst-Zaher a H. Zaher , Aplikace mezníkové morfometrie na lebky Představující řády živých savců
  2. (v) Mosier , „  určit, kdy jednoduchou konstrukci zatížení pro některé testy jsou známé  “ , Psychometrika , n O  4, 1939, str.  149-162
  3. (in) TM Cole , „  Historická poznámka: rané antropologické příspěvky k„ geometrické morfometrii “.  » , Amer. J. Phys. Anthropol. , N o  101, 1996, str.  291-296
  4. (v) F. Boas , „  Vodorovná rovina lebky a obecného problému Srovnání variabilních forem  “ , Science , n o  21, 1905, str.  862-863
  5. (in) EM Phelps , „  Recenze A principu horizontální roviny lebky  “ , Amer. J. Phys. Anthropol. , N o  17, 1932, str.  71-98

Související články

Externí odkaz

<img src="https://fr.wikipedia.org/wiki/Special:CentralAutoLogin/start?type=1x1" alt="" title="" width="1" height="1" style="border: none; position: absolute;">