Podtřída | Prkno |
---|---|
Vynálezce | Karl Pearson |
Kontingenční tabulka je metoda představuje údaje vyplývající z počtu umožňující odhadnout závislost mezi dvěma znaky. Spočívá v křížení dvou znaků populace (například věkové skupiny a skóre) spočítáním čísla odpovídajícího spojení „znak 1“ a „znak 2“.
Dílčí čísla jsou shromážděna v tabulce podvojného záznamu, řádkem pro první znak a sloupcem podle druhého znaku: toto je „pohotovostní tabulka“.
Tento jednoduchý nástroj reaguje na zásadní problém ve statistice: detekci možných závislostí mezi vlastnostmi zaznamenanými na jednotlivcích populace. Existence podmíněných závislostí skutečně naznačuje možnost ukládání výsledků průzkumu zhuštěnějším způsobem.
Pojem kontingenční tabulky , navržený tabulkami , je zobecněním klasické kontingenční tabulky.
Pojem kontingenční tabulka zavedl britský statistik Karl Pearson v eseji s názvem O teorii náhodnosti a jejím vztahu k asociaci a normální korelaci v roce 1904.
Studie se provádějí na několika postavách a poté se snaží zjistit, zda mezi nimi existuje nějaká souvislost. Za tímto účelem studujeme jednotlivce identifikující několik znaků najednou.
Souvisí například věk a jak často onemocníte?
Věk / pacient | 0 krát | 1 krát | 2krát | Třikrát | Čtyřikrát |
---|---|---|---|---|---|
20 ≤ věk <30 let | 4 jednotlivci | 2 jednotlivci | 2 jednotlivci | 1 osoba | 1 osoba |
30 ≤ věk <40 let | 4 | 3 | 3 | 1 | 1 |
40 ≤ věk <50 let | 7 | 2 | 1 | 0 | 0 |
50 ≤ věk <60 let | 3 | 2 | 1 | 1 | 1 |
věk ≥ 60 let | 0 | 0 | 0 | 1 | 1 |
Kontingenční tabulka vede přirozeně k pojmu podmíněné pravděpodobnosti v diskrétním případě.
U tabulky p řádků a sloupců q , označíme-li n ij číslo na křižovatce i-tého řádku (s p řádky) a j-tého sloupce, celkový počet seřazených jednotlivců podle tabulky je:
Podobně můžeme vypočítat součty podle řádku a sloupce:
Dílčí pracovní síla n ij představuje procento f ij z celkové pracovní síly:
Na toto procento se můžeme dívat jako na pravděpodobnost (od ): jde o společnou pravděpodobnost, že jedinec ze studované populace současně splňuje kritérium spojené s řádkem i ( L i ) a se sloupcem j ( C j ).
je pravděpodobnost, že jedinec splňuje podmínku L i . je podmíněná pravděpodobnost: je to pravděpodobnost, že jednotlivec odpoví na podmínku L i s vědomím, že respektuje podmínku C j .
a podobně:
Takže máme:
což je Bayesův vzorec .
S předchozím příkladem n = 42 a máme například následující výsledky: