Pohotovostní tabulka

Pohotovostní tabulka Obrázek v Infoboxu.
Podtřída Prkno
Vynálezce Karl Pearson

Kontingenční tabulka je metoda představuje údaje vyplývající z počtu umožňující odhadnout závislost mezi dvěma znaky. Spočívá v křížení dvou znaků populace (například věkové skupiny a skóre) spočítáním čísla odpovídajícího spojení „znak 1“ a „znak 2“.

Dílčí čísla jsou shromážděna v tabulce podvojného záznamu, řádkem pro první znak a sloupcem podle druhého znaku: toto je „pohotovostní tabulka“.

Tento jednoduchý nástroj reaguje na zásadní problém ve statistice: detekci možných závislostí mezi vlastnostmi zaznamenanými na jednotlivcích populace. Existence podmíněných závislostí skutečně naznačuje možnost ukládání výsledků průzkumu zhuštěnějším způsobem.

Pojem kontingenční tabulky , navržený tabulkami , je zobecněním klasické kontingenční tabulky.

Pojem kontingenční tabulka zavedl britský statistik Karl Pearson v eseji s názvem O teorii náhodnosti a jejím vztahu k asociaci a normální korelaci v roce 1904.

Příklad

Studie se provádějí na několika postavách a poté se snaží zjistit, zda mezi nimi existuje nějaká souvislost. Za tímto účelem studujeme jednotlivce identifikující několik znaků najednou.

Souvisí například věk a jak často onemocníte?

Věk / pacient 0 krát 1 krát 2krát Třikrát Čtyřikrát
20 ≤ věk <30 let 4 jednotlivci 2 jednotlivci 2 jednotlivci 1 osoba 1 osoba
30 ≤ věk <40 let 4 3 3 1 1
40 ≤ věk <50 let 7 2 1 0 0
50 ≤ věk <60 let 3 2 1 1 1
věk ≥ 60 let 0 0 0 1 1

Aplikace na podmíněné pravděpodobnosti

Kontingenční tabulka vede přirozeně k pojmu podmíněné pravděpodobnosti v diskrétním případě.

U tabulky p řádků a sloupců q , označíme-li n ij číslo na křižovatce i-tého řádku (s p řádky) a j-tého sloupce, celkový počet seřazených jednotlivců podle tabulky je:

Podobně můžeme vypočítat součty podle řádku a sloupce:

Dílčí pracovní síla n ij představuje procento f ij z celkové pracovní síly:


Na toto procento se můžeme dívat jako na pravděpodobnost (od ): jde o společnou pravděpodobnost, že jedinec ze studované populace současně splňuje kritérium spojené s řádkem i ( L i ) a se sloupcem j ( C j ).


je pravděpodobnost, že jedinec splňuje podmínku L i . je podmíněná pravděpodobnost: je to pravděpodobnost, že jednotlivec odpoví na podmínku L i s vědomím, že respektuje podmínku C j .


a podobně:


Takže máme:


což je Bayesův vzorec .

S předchozím příkladem n = 42 a máme například následující výsledky:

Poznámky a odkazy

Poznámky

  1. Viz toto téma Steffen L. Lauritzen , Přednášky o pohotovostních tabulkách ,2002( dotisk  1979, 1982, 1989) ( číst online )
  2. Karl Pearson, „  Matematické příspěvky k evoluční teorii  “ , The Internet Archive , Dulau & Co.,1904

Bibliografie

Související články