Detekce objektů

V počítačovém vidění označuje detekce objektu (nebo klasifikace objektu ) metodu umožňující detekovat přítomnost instance ( rozpoznání objektu ) nebo třídy objektů v digitálním obrazu . Zvláštní pozornost je věnována detekci obličeje a detekci osob . Tyto metody často zahrnují učení pod dohledem a mají aplikace ve více oborech, jako je vyhledávání obrázků obsahu nebo video dohled .

Problematický

Podle obvyklé terminologie můžeme rozlišovat detekci, lokalizaci a rozpoznávání objektů:

detekce (nebo klasifikace ): přítomnost instance objektu („automobil“) v obraze
Uznání : identifikace určitého orgánu ( „ v autě Michael Schumacher “, ‚ na tváři Gilles Deleuze ‘ ...)
lokalizace (nebo někdy detekce ): přesná situace instance (detekovaná nebo rozpoznaná) v obraze (ohraničující rámeček nebo segmentace oblasti)

U lokalizovaných vizuálních entit (objekt, obličej, osoba atd.) Se detekce a lokalizace často spojují. U „abstraktnějších“ entit, jako je interiér / exteriér, den / noc, venkov / město atd., Se to liší. Což se spíše týká rozpoznávání vizuálních scén . V druhém případě nemusí mít lokalizace vždy smysl, protože koncept je přítomen v celém obrazu.

Detekce třídy objektů je obecně považována za obtížnější problém než rozpoznávání konkrétní instance, protože je nutné identifikovat společné charakteristiky třídy a přitom ignorovat rozmanitost různých instancí v rámci uvedené instance. Tato odrůda může být způsobena mnoha faktory, včetně světelných podmínek nebo úhlu pohledu, ze kterého byla fotografie pořízena. Dále se zvyšuje v případě kloubových ( tj. Netuhých) předmětů, jako jsou chodci nebo zvířata.

Obecný přístup

Obecný přístup k detekci objektu v obraze (bez apriorní znalosti podmínek fotografování) se skládá ze tří kroků:

Určete potenciální umístění objektu, buď pomocí posuvného okna na obrázku, nebo přímo detekcí bodů zájmu v něm.
Extrahujte charakteristiky v obraze umožňující identifikovat třídu cílového objektu
Automaticky klasifikujte každé dílčí okno tak, že obsahuje hledaný objekt, či nikoli, nebo porovnejte extrahované charakteristiky s charakteristikami referenčního modelu.

Specifické metody

Byly vyvinuty specifické metody pro určité typy objektů, například pro detekci obličeje nebo detekci osob . Tyto metody mohou brát v úvahu specifické vlastnosti objektu, jako je poměr stran, přítomnost očí a úst v případě tváří atd.

Vhodný

Cílem párování je zaregistrovat obrázky (příklad: SIFT )

Rozsáhlý výzkum

Když jsou databáze obrázků velké, techniky párování se stanou neúčinnými, protože vyžadují příliš mnoho výpočtů. Metoda bag-of-visterms pak spočívá v agregaci místních detektorů podle předem definované slovní zásoby, slovníku. Inspirován technikou známou po dlouhou dobu v oblasti textu ( bag-of-words ), byl v roce 2003 navržen pro video.

Podívejte se také

Metoda Viola a Jones : jedna z prvních účinných technologií pro detekci objektů.

Poznámky a odkazy

viz například stránka chyby šablony mezinárodní kampaně PascalVOC {{odkaz na archiv}} : vyplňte parametr „ “|titre=
K. Murphy, A. Torralba, D. Eaton, WT Freeman, Detekce a lokalizace objektů pomocí místních a globálních funkcí Přednášky v informatice (bez doporučení). Seminář na Sicílii o rozpoznávání objektů, 2005
Josef Sivic, Andrew Zisserman , Video Google: Přístup k vyhledávání textů při porovnávání objektů ve videích, mezinárodní konference o počítačovém vidění 2003