Wardova metoda
Wardova metoda
Příroda |
Algoritmus rozdělení dat ( d )
|
---|
Ve statistikách , a to zejména v hierarchické klasifikace , Ward metoda je algoritmus, který umožňuje dva druhy oddíl má být seskupeny pro získání větší agregovanou oddíl.
Definice
Setrvačnost
pokud je skupina jednotlivců, z těžiště , rozdělena do k tříd čísel, které budeme nazývat a která mají jako těžiště pakG={Ei : i={1:ne}}{\ displaystyle G = \ {e_ {i} ~: ~ i = \ {1: n \} \}}
G {\ displaystyle g ~}
ne1, ne2, .., nek{\ displaystyle n_ {1}, ~ n_ {2}, ~ .., ~ n_ {k}}
G1, G2, .., Gk{\ displaystyle G_ {1}, ~ G_ {2}, ~ .., ~ G_ {k}}
G1, G2, .., Gk{\ displaystyle g_ {1}, ~ g_ {2}, ~ .., ~ g_ {k}}![g_ {1}, ~ g_ {2}, ~ .., ~ g_ {k}](https://wikimedia.org/api/rest_v1/media/math/render/svg/5d1cee6905d3f91c54ec85e4c0c58a73ddbddb30)
celková setrvačnost mraku se rovná: kde d je vzdálenost
Ját=1ne∑i=1ned(Ei,G)2 {\ displaystyle I_ {t} = {\ frac {1} {n}} \ součet _ {i = 1} ^ {n} d (e_ {i}, g) ^ {2} ~}![{\ displaystyle I_ {t} = {\ frac {1} {n}} \ součet _ {i = 1} ^ {n} d (e_ {i}, g) ^ {2} ~}](https://wikimedia.org/api/rest_v1/media/math/render/svg/f22cba2e8d8d8ce050adc95c28dbcb20c954067a)
setrvačnost mezi třídami se rovná:
JáE=1ne∑i=1knei×d(Gi,G)2{\ displaystyle I_ {e} = {\ frac {1} {n}} \ součet _ {i = 1} ^ {k} n_ {i} \ krát d (g_ {i}, g) ^ {2}}![{\ displaystyle I_ {e} = {\ frac {1} {n}} \ součet _ {i = 1} ^ {k} n_ {i} \ krát d (g_ {i}, g) ^ {2}}](https://wikimedia.org/api/rest_v1/media/math/render/svg/37befbb76e849e40d3e0556bafce7f025da9e054)
setrvačnost uvnitř třídy se rovná:
Jána=1ne∑i=1k∑j=1neid(Ej,Gi)2{\ displaystyle I_ {a} = {\ frac {1} {n}} \ součet _ {i = 1} ^ {k} \ součet _ {j = 1} ^ {n_ {i}} d (e_ {j }, g_ {i}) ^ {2}}
Metoda
Wardova metoda spočívá ve seskupení tříd tak, aby zvýšení setrvačnosti mezi třídami bylo maximální, nebo, což je podle Huygensovy věty stejné , takže zvýšení setrvačnosti uvnitř třídy bylo minimální.
Poznámky a odkazy
Poznámky
Reference
Specializované knihy
-
Saporta 2006 , s. 258.
Články publikované na internetu
-
[PDF] Mireille Summa-Gettler, Catherine Pardoux, „ La Classification Automatic “ (přístup k 26. listopadu 2011 ) .
Podívejte se také
Bibliografie
-
(fr) Gilbert Saporta , Pravděpodobnost, analýza a statistika dat , Paříž, Éditions Technip,2006, 622 s. ( ISBN 978-2-7108-0814-5 , číst online ).
Související články
Interní odkazy
externí odkazy