Ve statistikách je procustova analýza technikou pro porovnávání tvarů . Používá se pro deformaci objektu v, aby bylo co nejvíce podobné referenční (potenciálně nežádoucího), přičemž mezi objektem a reference pouze rozdíly, že oprávnění transformace ( rotace , překlady a resetování). Scale ) nemohl vymazat. Deformace odstraní rozdíly, které nejsou způsobeny vnitřním tvarem objektu (ale například předpětím zavedeným během získávání dat). Ty, které zůstanou, jsou považovány za objektivní a umožňují vyhodnotit stupeň podobnosti mezi objektem a odkazem.
Tuto techniku pojmenovali v roce 1962 Hurley a Catell ze společnosti Procrustes , zbojník řecké mytologie, kteří přinutili své oběti lehnout si na postel a silou změnili jejich velikost tak, aby odpovídala velikosti postele. Teoretické jádro této techniky je však o více než 20 let dříve (Mosier, 1939). Procusteanova analýza, vylepšená a zdokonalená mnoha vědeckými publikacemi, se používá ve všech oblastech, kde může být užitečná analýza forem, mimo jiné v biologii , psychologii, archeologii a medicíně .
Procrustes, postava z řecké mytologie , byl zloděj, který přinutil své oběti, aby si lehly na postel, a protáhl si nohy, pokud se jejich nohy nedotýkaly konce postele, nebo naopak jim sekají nohy, pokud vyčnívají z postele.
Vědecká verze příběhu, v oblasti analýzy forem, spočívá v tom, že se za postel vezme referenční forma, jejíž vlastnosti jsou známé, na kterou budeme položit oběti pocházející ze souboru předmětů ke studiu. Problém je v porovnání tvaru postele s tvarem obětí, což je obtížná operace, pokud jeden nemůže ležet na druhém.
K změně velikosti obětí a vyřešení problému vědci použijí ve skutečnosti sekeru překlad, který umožní přesunout oběti do středu postele, homothety , což změní velikost oběti tak, že se rovná velikosti postele a nakonec rotaci, která najde nejpohodlnější polohu pro oběť.
Ukazuje se tedy, že sekera nemůže změnit tvar objektu (všechny použité transformace udržují úhly). To umožňuje například v biologii porovnat tvar lebky delfína a krysy, čímž se eliminuje rozdíl ve velikosti mezi těmito dvěma lebkami, stejně jako rozdíly zavedené během digitalizace dat (poloha a orientace na měřicím zařízení , například).
Prvním krokem v Procrusteanově analýze je hledat ve tvaru, který má být studován, určitý počet bodů považovaných za referenční body nebo body zájmu, které budou schopny shrnout studovaný tvar. Pro ilustraci řešení problému Prokrustů můžeme uvažovat o případu oběti, symbolizované čtyřmi body zeleného čtyřúhelníku na diagramu, který se snaží položit na čtvercovou postel (na diagramu modře), boční 1, se středem na počátek.
Základní metoda, která je zde znázorněna, spočívá v odstranění tří složek v translaci, rotaci a měřítku ze zeleného čtyřúhelníku. Jediným omezením v pořadí operací je, že rotace musí být provedena jako poslední.
Odebrání komponenty v překladuTvar, který se má analyzovat, a reference jsou nyní soustředěny na počátek.
Centrum v čtyřúhelníku uvažovaného se musí shodovat se středem referenčního tvaru, který je umístěn na počátku referenčního framu. Chcete-li to provést, stačí vypočítat souřadnice středu zeleného čtyřúhelníku:
kde jsou souřadnice čtyř vrcholů zeleného čtyřúhelníku, pak platí pro všechny tyto body transformace :
Demontáž součásti váhyVelikost oběti lze vypočítat různými způsoby (závisí hlavně na zvolené metrice ). Zvažte zde jeden z nejpoužívanějších, kde velikost čtyřúhelníku, který má být analyzován, je:
To má dát uvažovanému tvaru stejnou velikost jako referenčnímu tvaru. Protože toto je 1, stačí použít transformaci na všechny body tvaru.
Demontáž rotující součástiPoslední krok, nejsložitější, spočívá ve zjištění, z jakého úhlu otočit zelený čtyřúhelník, aby se co nejlépe rozdělilo mezi čtyři body, které tvoří tvary, rozdíl, který představuje s referenčním tvarem.
Matematicky je tento rozdíl vyjádřen vzdáleností (která stejně jako oblast závisí na zvolené metrice), která je minimalizována jako funkce , například metodou nejmenších čtverců .
Tato vzdálenost, jakmile je minimalizována, se nazývá prokrustovská vzdálenost a je zajímavá pouze ve srovnání s prokrustskou vzdáleností jiných vzorků. Například v biologii umožňuje srovnání tvarů lebek vyhodnotit vzdálenost mezi několika druhy.
Předmětem analýzy je forma , složená z bodů zájmu o rozměru , který se budeme srovnávat s referencí .
Tvar je součástí třídy ekvivalence , generovaný odstraněním komponent překladu, rotace a měřítka.
Problém vyřešený procusteanskou analýzou je minimalizace vzdálenosti mezi a , pouze s použitím překladů, rotací a homothety . To znamená, že hledáme:
kde je soubor skladeb překladů, rotací a homothety (pohyby, které Prokrustes může provádět se svou sekerou) a norma odpovídající zvolené vzdálenosti, velmi často definovaná:
Maticový formalismusMaticový formalismus je ve skutečnosti ten, který v literatuře převládá (geometrický formalismus má pouze pedagogický zájem).
Opětovným převzetím zápisů geometrického formalismu se problém Procrustes rovná úpravě matice dimenze (cestovatel), aby se minimalizovala její vzdálenost od Procrustesova lůžka , také dimenze , pomocí jiné matice , matice operací povolených v Procrustes , dimenze . To znamená, že budeme hledat:
Pokud je skutečné, řešení problému se odhaduje podle:
Procustova vzdálenost (nebo Procustova vzdálenost) je prostředek k porovnání dvou obrazů představovaných množinou bodů zájmu popsaných v Booksteinových souřadnicích . Používá se v rámci morfometrie .
Vzdálenost d mezi dvěma objekty s 1 a s 2 složenými z n bodů je dána vztahem:
.Matrice vyjádření problému pomohl computerize analýzy Procrustes, najdeme její zavedení v mnoha vědeckých softwaru, například Matlab , Octave nebo R .
Procrusteanský problém, pokud stále odpovídá obecnému rámci, díky němuž objekt odpovídá jinému referenčnímu objektu, pomocí dobře definované sady transformace prvního objektu, zná nesčetné varianty:
Problém Procrustes tak pojmenovali Hurley a Catell v roce 1962, protože jejich program „je vhodný pro výkon nuceného přiřazování téměř jakýchkoli údajů téměř jakékoli hypotéze“. Mosier však v roce 1939, tedy před příchodem informačních technologií, dosáhl stejného řešení stejného problému. Studie, kterou provedl Cole v roce 1996, dokonce vysledovala první výskyt takového problému v publikaci z roku 1905, kterou napsal muž jménem Boas, a jeden z jejích studentů, Phelps, publikoval v roce 1932 rozšíření Boasovy metody s použitím střední hodnoty z několika vzorků, které tvoří jádro zobecněné Procusteanské analýzy , jejíž první výskyt pod tímto názvem pochází ze začátku 70. let.
Hustota literatury na toto téma, rozdílnost oblastí použití a množství problémů odvozených z původního problému Procrustes způsobily, že od konce šedesátých let bylo velmi obtížné vysledovat souvislý průběh problému, někteří objevy na toto téma někdy provádějí nezávisle dva lidé. V roce 1977 publikace deseti Berge identifikovala ne méně než 36 různých prokrustovských problémů.
Kvůli své užitečnosti při statistické analýze forem se Procustova analýza používá v medicíně, biologii, archeologii nebo dokonce ve fyzice (pro analýzu deformací).
Vývoj zobecněné analýzy Procrustes dále rozšířil spektrum aplikací, včetně například psychologie, kde je tato technika užitečná pro pochopení výsledků dotazníků s otevřeným profilem.
(en) JC Gower a GB Dijksterhuis, Procrustes Problems , Oxford University Press ,2004
Ostatní: