Křížového ověřování ( „ cross-validation “ ) je, v učení stroje , způsobu pro odhad spolehlivosti modelu založeného na technice vzorkování .
Předpokládejme, že máme statistický model s jedním nebo více neznámými parametry a tréninkovou datovou sadu, na které se model naučíme (nebo „trénujeme“). Výcvikový proces optimalizuje parametry modelu tak, aby co nejvíce odpovídal tréninkovým datům. Pokud pak vezmeme nezávislý validační vzorek, údajně ze stejné populace jako tréninkový vzorek, obecně se ukáže, že model nemodeluje validační data stejně jako tréninková data: hovoříme o overfittingu . Nezávislý ověřovací vzorek však není vždy k dispozici. Kromě toho se může výkon ověření modelu u různých ověřovacích vzorků lišit. Křížová validace umožňuje odvodit několik sad ověřování ze stejné databáze, a tak získat robustnější odhad s předpětím a rozptylem výkonu ověřování modelu.
Existuje mnoho variant ověření, ale můžeme nejprve rozlišit:
k | blok 1 | blok 2 | blok 3 |
---|---|---|---|
1 | validace | učení se | učení se |
2 | učení se | validace | učení se |
3 | učení se | učení se | validace |
Po provedení ověření modelu je poté nutné projít zkouškou s dříve vyhrazenou sadou zkoušek.
V klasifikačních úkolech může být distribuce tříd v databázi nevyvážená, tj. Počet pozorování na třídu nemusí být u jedné třídy stejný: pokud označíme počet pozorování -té třídy, pak existuje takový to . V tomto případě, aby se zabránilo zkreslení výkonu validace (a učení) změnou distribuce tříd z jedné sady validace (resp. Učení) do druhé, doporučuje se použít stratifikovanou křížovou validaci („stratifikovaná křížová validace“) . Stratifikace spočívá v zajištění stejného rozložení tříd ve všech použitých sadách školení a ověřování. To znamená, že pokud počáteční databáze představuje například 3 pozorování třídy 1 pro 7 pozorování třídy 2, pak každá ověřovací sada (resp. Učení) musí představovat tento poměr 3 pro 7.
V případě křížové validace s bloky jde jednoduše o distribuci tříd stejným způsobem z jednoho bloku do druhého. Ověření a výukové sady, které z něj budou odvozeny, zdědí tuto distribuci.