Analýza kanonické korelace , někdy nazývaná analýza kanonické korelace ( analýza kanonické korelace - angličtina), srovnává dvě skupiny kvantitativních proměnných aplikované na stejné jedince. Cílem kanonické analýzy je porovnat tyto dvě skupiny proměnných a zjistit, zda popisují stejný jev, v takovém případě se lze obejít bez jedné ze dvou skupin proměnných.
Příkladem je lékařská analýza prováděná na stejných vzorcích dvěma různými laboratořemi. Kanonická analýza zobecňuje metody tak rozmanité, jako je vícenásobná lineární regrese , diskriminační analýza a analýza faktoriální korespondence .
Jsou dva sloupcové vektory X a Y z příslušných rozměrů n a m : a z náhodných proměnných , které mají okamžik objednávky dva hotové. Můžeme definovat křížovou kovarianci jako matici velikosti n × m, jejíž prvek ( i , j ) je kovariancí x i a y j . V praxi to kovariance je často stanovena ze vzorku z X a Y, to znamená, že se po obou matric každý sloupec, který představuje provedení X a Y .
Kanonická korelační analýza hledá dva vektory a a b příslušných dimenzí n a m, které maximalizují korelaci mezi produkty bodů ( a · X) a ( b · Y) . Jinými slovy:
Náhodné proměnné U = a · X a V = b · Y jsou první dvojicí kanonických proměnných . Poté můžeme postup opakovat, abychom získali druhou dvojici proměnných nekorelovaných s první.