Centimorgan

V genetice se centimorgan (uvedeno cM ) označuje jednotku měření části genetické spojení  : tím nižší je hodnota, tím větší je pravděpodobnost, že dva geny na stejném chromozómu se oddělit společně (ve formě haplotyp ). Centimorgan je obvyklá jednotka měření na genetických mapách .

Centimorgan byla pojmenována na počest Genetik Thomas Morgan by Alfred Sturtevant , jeden z jeho studentů.

Úvod

Na základě pozorování, že měření genetické vazby, které by se chovalo jako fyzická vzdálenost, by bylo velmi užitečné pro práci v genetice, byla zakázána míra rekombinace, běžně používaná k měření genetických vazeb, kvůli své neaditivitě: ve skutečnosti pokud vezmeme v úvahu tři geny A, B a C seřazené podél chromozomu v tomto pořadí, rychlost rekombinace mezi A a C se nerovná součtu rychlostí rekombinace mezi A a B a rychlosti rekombinace mezi B a C .

To znamená, že centimorgan byla postavena z rychlosti rekombinace se chovat jako fyzická vzdálenost (to je důvod, proč mluvíme většinu času ze vzdálenosti v centimorgan). Přestože tato veličina má své vlastnosti, nejedná se o fyzickou vzdálenost: vztah mezi vzdáleností v centimorganu a fyzickou vzdáleností (v počtu párů bází) není ani konstantní, ani univerzální. Tento vztah se liší v závislosti na druhu, ale také podél genomu ve stejném organismu: například u lidí odpovídá 1 cM v průměru 1 megabázi , zatímco u Arabidopsis thaliana 1 cM odpovídá průměrně 200 kilobázím . Tento vztah se může dokonce lišit podle pohlaví jedinců stejného druhu.

Jeho vlastnosti jsou zvláště zajímavé pro modelování rekombinačních procesů, a tím usnadňují studium evoluční historie populací v genetice. Jednou z velkých obtíží při modelování a analýze populace, zejména v populační genetice , je zohlednění genetických rekombinací a jejich akumulace po generace.

Formální definice

Nechť je rychlost rekombinace mezi dvěma lokusy A a B. Vzdálenost v centimorganu mezi těmito dvěma lokusy je definována jako:

Takto definovaný centimorgan je zaručeno, že se bude chovat jako fyzická vzdálenost, protože respektuje Chaslesův vztah , zatímco specificky kvantifikuje genetickou vazbu, protože je to obraz rostoucí funkce rychlosti rekombinace (funkční vzdálenost od Haldane). Všimněte si, že existují další funkce vzdálenosti pro měření genetické vzdálenosti (nebo funkce mapy ), například funkce vzdálenosti Kosambi.

K dosažení této definice z míry rekombinace stačí vytvořit tři předpoklady:

  1. genetické interference (nebo crossover interference ) jsou zanedbatelné: jinými slovy, vzhled křížení nemá vliv na vzhled jiných křížení.
  2. rychlosti rekombinace jsou mezi 0 a 0,5.
  3. pro nekonečně malou rychlost rekombinace se jeho hodnota rovná hodnotě vzdálenosti v Morgan.

Uvažujme případ, ze tří lokusů A, B a C se nachází podél chromozomu a v tomto pořadí, a , a příslušné ceny rekombinace mezi A a B, B a C, a A a C, s použitím první hypotézu, že je možné Ukaž to:

a uvědomit si nejprve, že rychlost rekombinace není aditivní, a jednak, že pro každou hodnotu , respektují vztah Chasles , které jsou nezbytné pro kvalifikaci tohoto množství vzdálenosti. Díky druhé hypotéze je tento vzorec dobře a skutečně definován.

Chcete-li zjistit hodnotu , stačí použít třetí hypotézu, kterou je matematický vzorec takto:

Použitím omezeného vývoje logaritmu jsme dospěli k závěru, že pro vzdálenost v Morgan (a tedy 50 v centimorgan), tedy vzorec.

Zájem centimorganu: Haldanový rekombinační proces

Protože se toto měření chová jako fyzická vzdálenost, je velmi snadné modelovat rekombinace podél genomu. Je skutečně možné promítnout genetickou mapu chromozomu do fiktivní mapy, na které jsou dva lokusy vzdálené podle jejich vzdálenosti v centimorganu (a ne podle jejich fyzické vzdálenosti v párech bází). Na této fiktivní mapě sledují body rekombinace Poissonův proces intenzity , kde je délka chromozomu v Morganovi.

Odhad rychlosti rekombinace

Je možné určit rychlost rekombinace, která je nezbytná pro výpočet vzdálenosti v centimorganu, pomocí rekombinantních gamet a nerekombinantních gamet. Vezměme si příklad hrachu: křížením homozygotních linií [žlutá + hladká] x [zelená + vrásčitá] v F1 získáme 100% heterozygotů pro dva lokusy, pouze se dvěma možnými haplotypy: [žlutá + hladká] a [zelená + vrásčitá].

Pokud je míra rekombinace, kterou se člověk snaží odhadnout , pak je v F2 očekávaný podíl gamet [žlutá + hladká] , [zelená + vrásčitá] de , [žlutá + vrásčitá] de a [zelená + hladká] de . Realizace těchto proporcí umožňuje odhadnout rychlost rekombinace .

Příklad rekombinace u lidí

Předpokládejme dva geny spojené na stejném chromozomu, to znamená velmi blízko u sebe a neoddělující se křížením během meiózy. Například v systému krevních skupin MNS, bez ohledu na mnoho menších variant tohoto systému, má gen kódující protein, glykoforin A (GPA), dvě alely M a N, a gen kódující druhý protein, glykoforin B (GPB) ), má dvě alely S a s. V tomto systému proto existují 4 možné haplotypy: MS , Ms , NS , Ns . Předpokládejme, že otec, který dostal od svých rodičů haplotypy MS a Ns , tedy genotypu MS / Ns a fenotypu MNS, se oženil s homozygotní ženou MS / MS fenotypu MMSS. Jejich děti budou nutně MS od své matky a budou MS nebo NS od svého otce, ale nemohou být MS nebo NS od svého otce. Pokud nedojde k výjimečné rekombinaci, jejíž frekvence výskytu v rodinách dává představu o vzdálenosti mezi geny vyjádřenými v centimorganech, děti MM budou nutně SS a děti MN budou nutně Ss.

Mateřské haplotypy
SLEČNA SLEČNA
Otcovské haplotypy SLEČNA MS / MS MS / MS
Ns MS / Ns MS / Ns

V předchozím příkladu tedy ze 4 dětí jsou 2 MMSS a dvě MNS. Pokud původně známe otcovské haplotypy, dospěli jsme k závěru, že neexistuje žádný rekombinantní. Pokud, což by bylo výjimečné, jsme v této rodině pozorovali páté dítě, které by bylo MNSS (soubor dalších markerů potvrzujících otcovství), bylo by to rekombinantní a řekli bychom, že procento rekombinace v této poslední rodině je jedno u pěti dětí, nebo 20%, takže vzdálenost mezi těmito dvěma geny je asi 11 centimorganů. Pokud neznáme rodičovské haplotypy, vypočítaná pravděpodobnost rekombinace není úplně stejná, protože rodičovské haplotypy jsou určovány z dětí. Proto bylo nutné nechat studovat velký počet rodin (nejlépe velkých) nejméně dvou dětí a / nebo rodin po tři generace, aby bylo možné před molekulární biologií odhadnout vzdálenost vyjádřenou v centimorganech.

Metoda lodního skóre umožňuje akumulovat poměry pravděpodobností pozorování vypočítaných pro různé míry rekombinace v každé studované rodině za předpokladu nezávislosti. Ve skutečnosti vyjádřením poměrů vypočítaných pro každou zvolenou rychlost v desítkových logaritmech získáme skóre, která lze přidat jako nové studované rodiny. Nejvyšší skóre získané pro danou míru odpovídá maximální pravděpodobnosti .

Tato metoda rodinného studia umožnila před molekulární biologií určit nejen frekvenci rekombinace mezi dvěma geny, ale také pořadí genů na chromozomu, když byly spojeny tři nebo více genů.

Zvířecí model, Drosophila

Živočišný model Drosophily díky velkému počtu rychle se množících jedinců a svým čtyřem velkým polytenním chromozomům velmi dobře viditelným v buňkách slinných žláz umožnil TH Moganovi a jeho učedníkům následovat několik generací jednotlivců a teoretizovat původ (lokalizovaný na chromozomu ) a důsledky ( křížení , genetická mapa ...) Mendelovy genetiky .

Rychlost rekombinace podél chromozomů Drosophila lze odhadnout pomocí „ kalkulačky rychlosti rekombinace “.

Poznámky a odkazy

  1. (in) JBS Haldane, „  Kombinace hodnot vazeb a výpočet vzdáleností mezi lokusy propojených faktorů  “ , Journal of Genetics 8.29 ,1919, str.  299-309 ( číst online )
  2. (in) AC Cavell, „  Collinearity entre 30-centimorgan segment of Arabidopsis thaliana chromozome 4 and duplicated areas dans le Brassica napus genome  “ , Genome ,1998, str.  41 (1): 62-69 ( číst online )
  3. (in) „Haldane's Mapping Function“ v Encyclopedia of Genetics, Genomics, Proteomics and Informatics , Springer Nizozemsko,2008( ISBN  978-1-4020-6754-9 , DOI  10.1007 / 978-1-4020-6754-9_7297 , číst online ) , s.  836–836
  4. (in) DD Kosambi , „Odhad vzdálenosti mapy od hodnot rekombinace“ v DD Kosambi: Vybrané práce z matematiky a statistiky , Springer, Indie2016( ISBN  978-81-322-3676-4 , DOI  10.1007 / 978-81-322-3676-4_16 , číst online ) , s.  125–130

Podívejte se také


<img src="https://fr.wikipedia.org/wiki/Special:CentralAutoLogin/start?type=1x1" alt="" title="" width="1" height="1" style="border: none; position: absolute;">