Křížová validace

Křížového ověřování ( „  cross-validation  “ ) je, v učení stroje , způsobu pro odhad spolehlivosti modelu založeného na technice vzorkování .

Užitečnost křížové validace

Předpokládejme, že máme statistický model s jedním nebo více neznámými parametry a tréninkovou datovou sadu, na které se model naučíme (nebo „trénujeme“). Výcvikový proces optimalizuje parametry modelu tak, aby co nejvíce odpovídal tréninkovým datům. Pokud pak vezmeme nezávislý validační vzorek, údajně ze stejné populace jako tréninkový vzorek, obecně se ukáže, že model nemodeluje validační data stejně jako tréninková data: hovoříme o overfittingu . Nezávislý ověřovací vzorek však není vždy k dispozici. Kromě toho se může výkon ověření modelu u různých ověřovacích vzorků lišit. Křížová validace umožňuje odvodit několik sad ověřování ze stejné databáze, a tak získat robustnější odhad s předpětím a rozptylem výkonu ověřování modelu.

Techniky ověřování

Existuje mnoho variant ověření, ale můžeme nejprve rozlišit:

Tabulka distribuce dat pro křížovou validaci na k = 3 bloky
k blok 1 blok 2 blok 3
1 validace učení se učení se
2 učení se validace učení se
3 učení se učení se validace

Po provedení ověření modelu je poté nutné projít zkouškou s dříve vyhrazenou sadou zkoušek.

Správa nevyvážených databází

V klasifikačních úkolech může být distribuce tříd v databázi nevyvážená, tj. Počet pozorování na třídu nemusí být u jedné třídy stejný: pokud označíme počet pozorování -té třídy, pak existuje takový to . V tomto případě, aby se zabránilo zkreslení výkonu validace (a učení) změnou distribuce tříd z jedné sady validace (resp. Učení) do druhé, doporučuje se použít stratifikovanou křížovou validaci („stratifikovaná křížová validace“) . Stratifikace spočívá v zajištění stejného rozložení tříd ve všech použitých sadách školení a ověřování. To znamená, že pokud počáteční databáze představuje například 3 pozorování třídy 1 pro 7 pozorování třídy 2, pak každá ověřovací sada (resp. Učení) musí představovat tento poměr 3 pro 7.

V případě křížové validace s bloky jde jednoduše o distribuci tříd stejným způsobem z jednoho bloku do druhého. Ověření a výukové sady, které z něj budou odvozeny, zdědí tuto distribuci.

Podívejte se také

Interní odkazy

Reference

  1. Payam Refaeilzadeh, Lei Tang, Huan Liu, „  Cross-Validation  “ ( ArchivWikiwixArchive.isGoogle • Que faire? ) (Přístup k 20. dubnu 2020 )
  2. Andrew W. Moore, Cross-validation for detecting and prevent overfitting


<img src="https://fr.wikipedia.org/wiki/Special:CentralAutoLogin/start?type=1x1" alt="" title="" width="1" height="1" style="border: none; position: absolute;">