Markovův řetězec

V matematiky , je Markov řetěz je diskrétní Markov proces nebo kontinuální i diskrétní stavový prostor. Markovův proces je stochastický proces mající Markovovu vlastnost  : informace užitečné pro předpovídání budoucnosti jsou zcela obsaženy v současném stavu procesu a nejsou závislé na předchozích stavech (systém nemá žádnou „paměť“). Markovské procesy jsou pojmenovány podle jejich vynálezce Andreje Markova .

Diskrétní časové Markov proces je sekvence z náhodných proměnných s hodnotami ve státní prostoru , který budeme poznámka v následujícím textu. Hodnota je stav procesu v daném okamžiku. Aplikace, kde je stavový prostor konečný nebo spočetný, jsou nespočetné: mluvíme pak o Markovových řetězcích nebo o diskrétních stavových prostorových Markovových řetězcích . Základní vlastnosti obecných Markovových procesů , například vlastnosti rekurence a ergodicity , lze uvést nebo dokázat jednodušeji v případě diskrétních stavových prostorových Markovových řetězců . Tento článek se týká přesně Markovových řetězců s diskrétním stavovým prostorem .

Andrei Markov zveřejnil první výsledky v markovských řetězcích konečného stavu prostoru v roce 1906 . Zobecnění na spočetný nekonečný stavový prostor publikoval Kolmogorov v roce 1936 . Markov procesy jsou spojeny s Brownova pohybu a ergodické hypotézy , dvě tématech statistické fyziky , které byly na počátku velmi důležitá XX th  století .

Slabý majetek Markov

Definice

Toto je charakteristická vlastnost markovského řetězce: predikce budoucnosti ze současnosti není zpřesněna dalšími informacemi o minulosti, protože všechny informace užitečné pro predikci budoucnosti jsou obsaženy v současném stavu proces. Slabá Markovova vlastnost má několik ekvivalentních forem, které všechny znamenají pozorování, že podmíněný zákon poznání minulého času, tj. Poznání, je funkcí pouze:

Běžnou variantou Markovových řetězců je homogenní Markovův řetězec , u kterého je pravděpodobnost přechodu nezávislá na  :

Ve zbytku článku budou uvažovány pouze homogenní Markovovy řetězce. Zajímavou aplikaci nehomogenních Markovových řetězců na kombinatorickou optimalizaci najdete v článku Simulované žíhání . Existuje silná vlastnost Markov , spojená s představou času zastavení  : tato silná vlastnost Markov je zásadní pro důkaz důležitých výsledků (různá kritéria opakování, silný zákon velkého počtu pro řetězce Markov). Je to uvedeno v článku „  Markovský majetek  “.

Kritérium

Základní kritérium  -  Dovolme být posloupností nezávislých náhodných proměnných stejného zákona s hodnotami v prostoru a buď měřitelnou mapou v Předpokládejme, že posloupnost je definována relací opakování: a předpokládejme, že sekvence je nezávislá na Then je homogenní Markovův řetězec.

Příklad: problém sběrače nálepek  :

Petit Pierre sbírá portréty jedenácti hráčů národního fotbalového týmu, které najde na samolepkách uvnitř obalu čokoládových tyčinek; pokaždé, když si koupí tablet, má šanci 1 z 11 najít portrét hráče č. (pro všechno ). Poznámka: stav kolekce Pierre Petit, po otevření obalu svého e čokoládové tyčinky. je Markov řetěz od , protože se vejde do předchozího rámce pro volbu od kde náhodné proměnné jsou nezávislé a jednotné náhodné proměnné jsou  : jsou to po sobě jdoucí čísla viněty čerpané z čokoládových tyčinek. Průměrná doba potřebná k dokončení kolekce (zde je počet tablet, které si Petit Pierre musí v průměru koupit, aby mohla dokončit svou sbírku), je u kolekce vinět celkem, kde je th harmonické číslo . Například čokoládové tyčinky.

Poznámky:

Pravděpodobnosti přechodu

Definice

Definice  -  Číslo se nazývá pravděpodobnost státně to- přechodu stavu v jednom kroku , nebo pravděpodobnost státně to- přechodu stavu , pokud není dvojznačnost. Toto číslo si často všimneme

Rodinná čísla se nazývají přechodová matice , přechodové jádro nebo přechodový operátor Markovova řetězce.

Terminologická přechodová matice je nejpoužívanější, ale je vhodné, přísně vzato, pouze když pro celé číslo When je konečné, například kardinál, lze vždy číslovat prvky libovolně od 1 do toho, co určuje problém, ale nedokonale, protože toto přečíslování je v mnoha příkladech protiintuitivní.

Model Ehrenfest: dva psi a jejich blechy:

Dva psi sdílejí blechy následujícím způsobem: v každém okamžiku je náhodně vybrána jedna z blech a poté skočí z jednoho psa na druhého. Stav systému je popsán prvkem kde

Stejně tak má prvky, ale jejich číslování od 1 do by bylo nepříjemné sledovat vývoj systému, který spočívá v náhodném výběru jedné ze souřadnic a změně jeho hodnoty. Pokud chceme systému porozumět méně podrobně (protože nejsme schopni rozeznat čip od jiného), můžeme jednoduše prostudovat počet čipů u psa č. 1, což znamená zvolit znovu, pro pochopení by bylo škoda přečíslovat stavy z 1 na Všimněte si, že pro tuto novou modelování protože například počet žetonů na zadní straně psa č. 1 se změní z k na k-1, pokud je vybrán jeden z těchto k žetonů mezi N čipy přítomnými v „systému“. Tento model se častěji označuje jako „  model Ehrenfest Urny  “. To bylo představeno v roce 1907 Tatianou a Paulem Ehrenfestem pro ilustraci některých „paradoxů“, které vznikly v základech rodící se statistické mechaniky, a pro modelování růžového šumu . Ehrenfest Model urna byla zvažována matematik Mark Kac, aby byl „pravděpodobně jedním z nejvíce poučných modelů v celé fyziky.“

Spíše než přečíslování stavů od 1 je proto v mnoha případech ergonomičtější přijímat konečné nebo nekonečné matice, jejichž řádky a sloupce jsou „číslovány“ pomocí prvků Součin dvou takových „matic“, a je pak definován velmi přirozeně podle analogicky s klasičtějším vzorcem součinu dvou čtvercových matic velikosti

Vlastnosti

Tvrzení  -  Matice přechodu je stochastická  : součet členů kteréhokoli řádku vždy dává 1.

Tvrzení  -  Zákon Markovova řetězce je charakterizován dvojicí tvořenou jeho přechodovou maticí a jeho počátečním zákonem (zákonem ): pro všechny společné právo je dáno

Demonstrace

Indukcí, na hodnosti 0,

V řadě pózováním díky slabé Markovově vlastnosti, takže pokud má očekávaný výraz, pak také.

Když studujeme konkrétní Markovův řetězec, jeho přechodová matice je obecně dobře definovaná a fixovaná během celé studie, ale počáteční zákon se může během studia změnit a notace musí odrážet původní zákon uvažovaný v daném okamžiku: pokud v okamžiku ve studii považujeme Markovův řetězec počáteční distribuce definovaný do té doby jsou zaznamenány pravděpodobnosti a očekávání jsou zaznamenána Zejména pokud řekneme, že Markovův řetězec začíná od pravděpodobností jsou zaznamenány a očekávání jsou zaznamenána

Síly přechodové matice

Pro pravděpodobnosti přechodu v kroku, není závislá na  :

Tvrzení  -  matice přechodu ve stupních , se rovná výkonu th přechodného matice Poznamenáváme, a

Demonstrace

Opakováním. Na 1. úrovni je to důsledek homogenity markovského řetězce již zmíněného v sekci Slabá markovská vlastnost  :

Hodnost nebo

Na závěr dělíme dva krajní členy této posloupnosti rovností, pokud není tento poslední člen nulový, v takovém případě můžeme libovolně definovat , tedy například rovno

Jednoduchou aplikací vzorce pro celkovou pravděpodobnost odvodíme mezní zákony Markovova řetězce.

Dodatek  -  Zákon je dán

Zejména,

Při psaní matice, je-li právem se považuje za line-vektoru s tím, že upravené, do:

Klasifikace států

Pro říkáme, že je přístupný z tehdy a jen tehdy, pokud existuje taková, že jsme se označují:

Říkáme to a komunikujeme tehdy a jen tehdy, pokud takové existují a označujeme:

Vztah ke komunikaci , známý je vztah ekvivalence . Když mluvíme o třídě, když hovoříme o stavech Markovova řetězce, obecně se jedná o třídy ekvivalence pro vztah , o kterém mluvíme. Pokud všechny státy komunikují, říká se, že markovský řetězec je neredukovatelný .

Vztah, který má být přístupný , se vztahuje na třídy ekvivalence: pro dvě třídy a , máme

Relace je relační řád mezi třídami ekvivalence.

Třída je považována za konečnou, pokud nevede k žádné jiné, tj. Pokud je třída pro vztah minimální , jinak se říká, že je přechodná . Příslušnost k finální nebo přechodné třídě má důsledky na pravděpodobnostní vlastnosti státu v Markovově řetězci, zejména na jeho stav jako opakující se stav nebo přechodný stav . Počet a povaha závěrečných tříd diktují strukturu souboru stacionárních pravděpodobností , které přesně shrnují asymptotické chování Markovova řetězce, jak je vidět v následující části a ve dvou příkladech podrobně popsaných na konci této stránky.

Je

Období o stavu je GCD sady li oba státy komunikují, mají stejnou periodu: proto můžeme hovořit o období třídy stavů. Pokud je perioda rovna 1, říká se, že třída je neperiodická . Aperiodicita stavů Markovova řetězce podmíňuje konvergenci zákona směrem ke stacionární pravděpodobnosti, viz stránka Stacionární pravděpodobnost Markovova řetězce .

Klasifikaci stavů a ​​jejich období lze snadno přečíst na Markovově řetězovém grafu . Pokud jsou však všechny prvky přechodové matice přísně pozitivní, je Markovův řetězec neredukovatelný a neperiodický: kreslení grafu Markovova řetězce je potom nadbytečné.

Stacionární zákon

Definice

Ve stavovém prostoru může být jedno nebo více měření , například: nebo dokonce

Takové měření se nazývá stacionární měření . Stacionární míra je vlastní funkce transpozice přechodové matice spojená s vlastní hodnotou 1. Nazývá se stacionární pravděpodobnost nebo stacionární zákon, pokud splňuje další podmínky:

Pojem „  stacionární  “ je odůvodněn následujícím návrhem:

Tvrzení  -  Pokud je původní zákon Markovova řetězce (tj. Zákon ) stacionární pravděpodobnost, pak pro celý zákon je

Demonstrace

To vyplývá z vlastností sil přechodové matice uvedených výše: zákon μ n z X n je vyjádřen jako funkce zákona μ 0 z X 0 takto: nebo znamená

Obecněji řečeno, Markovův řetězec je stacionární proces právě tehdy, je-li jeho počátečním zákonem stacionární pravděpodobnost .

Existence a jedinečnost

V případě diskrétních stavových prostorových Markovových řetězců určují určité vlastnosti procesu, zda existuje stacionární pravděpodobnost a zda je jedinečná nebo ne:

Pokud má Markovův řetězec alespoň jeden pozitivní rekurentní stav, pak existuje stacionární pravděpodobnost. Pokud existuje stacionární pravděpodobnost taková , pak je stav pozitivní rekurentní a naopak.

Věta  -  Pokud má Markovův řetězec pouze jednu závěrečnou třídu, existuje maximálně jedna stacionární pravděpodobnost. Pak máme ekvivalenci mezi 3 tvrzeními:

Máme také rovnocennost

Tato věta platí zejména pro neredukovatelné Markovovy řetězce, protože tyto mají pouze jednu třídu (což je tedy nutně konečná třída); ověřují se zejména neredukovatelné Markovovy řetězce

Silný zákon velkého počtu a ergodicity

V případě neredukovatelného a opakujícího se pozitivního Markovova řetězce platí silný zákon velkého počtu : průměr funkce nad instancemi Markovova řetězce se rovná jeho průměru podle jeho stacionární pravděpodobnosti. Přesněji řečeno, za předpokladu budeme mít téměř jistě  :

Průměr hodnoty instancí se tedy dlouhodobě rovná očekávání podle stacionární pravděpodobnosti. Zejména tato rovnocennost s prostředky platí, pokud je indikátorová funkce podmnožiny stavového prostoru:

To umožňuje přiblížit se stacionární pravděpodobnosti empirickým rozložením (což je histogram sestrojený z konkrétní sekvence), jako v případě náhodné chůze s bariérou .

Zejména pokud je proces sestaven tak, že se jako počáteční zákon použije stacionární pravděpodobnost, je posun definován zachovává míru, díky níž je Markovův řetězec měřeným dynamickým systémem . Silný zákon velkého počtu vede k tomu, že Markovův řetězec je ergodický dynamický systém . Ergodicita je silnější než silný zákon velkého počtu, protože můžeme odvodit například to, že má téměř určitou hranici, ale je také slabší, protože v zásadě vyžaduje stacionaritu markovského řetězce, což u silných zákon velkých čísel.

Konvergence k stacionárnímu zákonu

V případě, že Markov řetěz je nesnížitelný , pozitivní recidivující a aperiodické, pak konverguje k matrici, z nichž každá řada je jedinečná pevná distribuce zejména zákon o konverguje k nezávisle na počáteční práva V případě stavového prostoru hotového, to je prokázáno Perron-Frobeniovou větou . Všimněte si, že je přirozené, že posloupnost definovaná indukcí relací má pro limit případně pevný bod této transformace, tj. Řešení rovnice

Markovovy řetězce konečného stavu prostoru

Pokud je Markovův řetězec neredukovatelný a je-li jeho stavový prostor konečný, všechny jeho stavy se pozitivně opakují. Poté platí velký zákon velkého počtu.

Obecněji řečeno, všechny prvky konečné třídy jsou kladné opakující se, ať už je stavový prostor konečný nebo nekonečný spočetný.

Kvazi-stacionární distribuce absorbovaného Markovova řetězce

Nechť je Markovův řetězec přes množinu přirozených čísel . Předpokládejme, že stav 0 pohlcuje a řetězec je téměř jistě pohlcen na 0. Nechť je doba absorpce na 0. Říkáme, že pravděpodobnost zapnutí je kvazi-stacionární rozdělení, pokud pro všechny a pro všechny ,

Říkáme, že pravděpodobnost na je Yaglom omezení , pokud pro všechno a všechno ,

Yaglomův limit je kvazi-stacionární distribuce . Pokud existuje, je Yaglomův limit jedinečný. Na druhou stranu může existovat několik kvazi-stacionárních distribucí.

Pokud je distribuce kvazi-stacionární, pak existuje reálné číslo takové, že .

Hodnocení

Ve výše uvedených vzorcích je prvkem ( ) pravděpodobnost přechodu z do . Součet prvků řady je vždy roven 1 a stacionární rozdělení je dáno levým vlastním vektorem přechodové matice.

Někdy se setkáváme s přechodovými maticemi, ve kterých je výraz ( ) pravděpodobností přechodu z do , v takovém případě je přechodová matice jednoduše transpozicí zde popsaného. Součet prvků sloupce má pak hodnotu 1. Kromě toho je pak stacionární rozdělení systému dáno pravým vlastním vektorem přechodové matice namísto levého vlastního vektoru.

Příklad: Doudou křeček

Křeček Doudou zná ve své kleci pouze tři místa: hobliny, kde spí, krmítko, kde jí a kolo, kde cvičí. Jeho dny jsou si navzájem velmi podobné a jeho činnost snadno představuje markovský řetězec. Každou minutu může buď změnit svou činnost, nebo pokračovat v té, kterou dělal. Proces pojmenování bez paměti není vůbec přehnaný, když mluvíme o Doudou.

Diagramy

Grafy mohou zobrazit všechny šipky, z nichž každá představuje pravděpodobnost přechodu. Je však čitelnější, pokud:

Matice přechodu

Matice přechodu tohoto systému je následující (řádky a sloupce odpovídají stavům znázorněným na čipu , podavači , grafu kola ):

Předpovědi

Předpokládejme, že Doudou spí během první minuty studia.

Po jedné minutě můžeme předpovědět:

Po jedné minutě tedy existuje 90% šance, že Doudou stále spí, 5% bude jíst a 5% bude běhat.

Po 2 minutách existuje 4,5% šance, že křeček sní.

Obecně řečeno, na minuty: a

Teorie ukazuje, že po určité době je zákon pravděpodobnosti nezávislý na původním zákoně. Všimněme si to  :

Konvergenci získáme tehdy a jen tehdy, pokud je řetězec neperiodický a neredukovatelný . To je případ našeho příkladu, abychom mohli napsat:

S vědomím toho získáváme:

Doudou proto tráví 88,4% svého času spánkem, 4,42% jídlem a 7,18% běháním.

Ilustrace dopadu modelu

Následující příklad si klade za cíl ukázat důležitost modelování systému. Dobré modelování umožňuje odpovídat na složité otázky pomocí jednoduchých výpočtů.

Studujeme (fiktivní) civilizaci složenou z několika společenských tříd a ve které se jednotlivci mohou pohybovat z jedné třídy do druhé. Každá fáze bude představovat jeden rok. Budeme uvažovat spíše o linii než o jednotlivci, abychom se vyhnuli získání dvoustých občanů. Existují čtyři různé sociální statusy:

V této společnosti:

Abychom příklad trochu zkomplikovali a ukázali tak rozsah aplikací markovských řetězců, vezmeme v úvahu, že státní zaměstnanci jsou voleni na několik let. Budoucnost jednotlivého státního zaměstnance proto závisí na délce doby, kdy byl státním zaměstnancem. Jsme tedy v případě nehomogenního Markovova řetězce. Naštěstí se můžeme snadno vrátit k homogennímu řetězci. Skutečně stačí přidat umělý stav pro každý rok mandátu. Namísto stavu 4: Official , budeme mít stát:

Pravděpodobnosti spojující dva po sobě jdoucí umělé stavy (například třetí a čtvrtý rok) mají hodnotu 1, protože se má za to, že jakýkoli spuštěný mandát končí (změnou hodnoty těchto pravděpodobností by se dal model opakovat). Stanovme dobu trvání mandátů na dva roky, přičemž kontingent státních zaměstnanců lze každý rok prodloužit o polovinu. Pak máme následující graf:

K modelování voleb, které nejsou každoroční, by bylo rovněž nutné přidat fiktivní státy (volební rok, jeden rok od posledních voleb atd.).

Matice se poté zapíše:

Jak je vysvětleno výše, uveďte pravděpodobnosti přechodu po etapách. Stejně tak je pravděpodobné, že po letech zůstanete ve státě pro linii, která je součástí společenské třídy . Chcete-li vědět, co se po letech stane s otrokem , stačí napsat:

Kde je pravděpodobnost, že po letech budete v sociální třídě s vědomím, že sledovaná linie opustila stát otroka?

Pokud známe čísla každé sociální třídy v roce 0, stačí vypočítat:

Získáme tak rozdělení populace v různých sociálních třídách (na konci let). Vynásobením tohoto vektoru celkovým počtem obyvatel získáme počty každé třídy na konci let.

Položme si nyní následující otázku: „Na konci let, kolik řádků již bude mít vysoký úředník, který dokončí svůj mandát?“ "

Odpověď se liší od počtu mandátů vykonaných v letech, protože existuje možnost opětovného zvolení. Odpovědi na tuto otázku se jeví jako obtížné (stále by to mělo být možné). Ve skutečnosti stačí změnit modelování problému. Pojďme tedy k novému modelu, abychom na tuto otázku odpověděli. (Na druhou stranu nám to neumožňuje odpovědět na předchozí otázky, tedy představení těchto dvou modelů.)

Postačí upravit graf následujícím způsobem:

Přidáme absorpční vršek, protože jakmile linka dokončí mandát, již se to nebere v úvahu.

Pokud jsou někteří čtenáři kritičtí, mohou říci, že model je špatný, protože linky s voleným úředníkem se již voleb neúčastní. Není to tak. Počet zvolených úředníků je ve skutečnosti úměrný počtu občanů. Nepřidělení bývalých vysokých úředníků mezi kandidáty proto nemění pravděpodobnost zvolení občana, protože počet obyvatel je menší a počet nabízených pozic je také. Tento model umožňuje přesně odpovědět na položenou otázku.

Proto máme novou přechodovou matici:

Provedením stejných výpočtů jako v předchozích otázkách získáme na posledním řádku vektoru řešení procento řádků, které mají dokončený alespoň jeden mandát, nebo počet (pokud vynásobíme celkovým počtem populace). Jinými slovy, opětovné modelování problému umožňuje odpovědět na otázku, která se zdála tak komplikovaná jednoduchým výpočtem sil matice.

Aplikace

Poznámky a odkazy

Podívejte se také

Související články

Bibliografie

externí odkazy