Genetický kód je soubor pravidel, aby bylo možné převést informace obsažené v genomu z živých buněk , aby se syntetizovat proteiny . V širším slova smyslu, to stanovuje korespondence mezi genotypem a fenotypem dusičnanu amonného organismu . Tento kód je založen zejména na korespondenci mezi na jedné straně tripletem nukleotidů nazývaných kodony na messengerové RNA a na druhé straně proteinogenními aminokyselinami začleněnými do proteinů syntetizovaných během fáze translace messengerové RNA podle ribozomy .
Až na několik výjimek odpovídá každý kodon jedné proteinogenní aminokyselině. Protože genetická informace je kódována přesně stejným způsobem v genech velké většiny různých živých druhů , je tento specifický genetický kód obecně označován jako standardní genetický kód, nebo kanonický, nebo dokonce jednoduše jako „genetický kód“; existuje však určitý počet variant tohoto genetického kódu, ale které jsou obecně omezeny na několik kodonů. Takové varianty existují například v samotných lidských buňkách, mezi jejich cytosolem a jejich mitochondriemi .
Korespondence mezi messengerovými kodony RNA a proteinogenními aminokyselinami je obecně prezentována ve formě tabulek spojujících každý ze 64 kodonů nebo tripletů čtyř možných nukleových bází ( 4 3 = 64 ) s jednou z 22 proteinogenních aminokyselin.
Obecně řečeno, široká veřejnost někdy nazývá „genetický kód“, což je ve skutečnosti genotyp buňky, to znamená všechny její geny .
Během exprese proteinů z genomu se segmenty genomové DNA přepisují do messengerové RNA . Tato mRNA (nebo mRNA) obsahuje nekódujících oblastí, které nejsou převedeny do proteinů, a jednu nebo více kódujících oblastí, které jsou přeloženy pomocí ribozomy produkovat jeden nebo více proteinů . MRNA je tvořena sekvencí čtyř typů nukleových bází , A , C , G a U , které tvoří „ písmena “, kterými je genetický kód napsán. Posledně jmenovaný je tvořen „ slovy “ o 3 písmenech (nukleotidy) nazývaných kodony . V kódujících oblastech messengerové RNA je každý kodon přeložen do jedné z 22 proteinogenních aminokyselin v proteinu, který má být syntetizován.
Počet třípísmenových slov převzatých ze čtyřpísmenné abecedy je 4 3 , genetický kód obsahuje 64 různých kodonů, přímo kódujících 20 takzvaných „standardních“ aminokyselin, stejně jako konec translačního signálu, přičemž druhý je kódováno jedním ze 3 stop kodonů nebo ukončovacích kodonů. Na úrovni určitých stop kodonů jsou vloženy dvě vzácné aminokyseliny, selenocystein a pyrrolysin , jejichž překódování do aminokyselinových kodonů probíhá v přítomnosti konkrétních struktur typu kmenová smyčka nebo vlásenka, vyvolaných specifickými inzertními sekvencemi na messenger RNA.
Kodon je definován prvním nukleotidem ze které překlad začíná. Řetězec GGGAAACCC lze tedy číst podle kodonů GGG · AAA · CCC, GGA · AAC a GAA · ACC v závislosti na tom, zda je čtení kodonu zahájeno z prvního, druhého nebo třetího nukleotidu. Libovolnou nukleotidovou sekvenci lze tedy číst podle tří odlišných čtecích rámců, jejichž výsledkem jsou překlady do zcela odlišných aminokyselin: v našem příkladu bychom měli aminokyseliny Gly - Lys - Pro , Gly - Asn a Glu - Thr .
V genech, čtecí rámec obecně začíná AUG kodonu kódující methionin , nebo N -formylméthionine v bakteriích a v mitochondriích a chloroplastech z eukaryotického .
Genetická překlad do ribozomu začíná startovacím kodonem , někdy zvané počáteční kodon. Na rozdíl od stop kodonů samotný startovací kodon nestačí k zahájení překladu. Tyto vazby ribosomů ( RBS ) v prokaryota a iniciačních faktorů v prokaryota a eukaryotes jsou nezbytné pro iniciaci translace. Nejběžnější iniciační kodon je AUG odpovídající methioninu nebo v bakteriích , na N -formylmethionine . GUG a UUG, které odpovídajícím způsobem odpovídají valinu a leucinu ve standardním genetickém kódu, mohou být také iniciačními kodony v určitých organismech, které se v tomto případě interpretují jako kodony pro methionin nebo N- formylmethionin .
Tři stop kodony UAG, UGA a UAA, dostaly během svého objevu jména, jantarová , opálová a okrová . Nazývají se také stop kodony nebo terminační kodony. Způsobují zastavení ribozomu a uvolnění nově vytvořeného polypeptidového řetězce nepřítomností transferové RNA s vhodnými antikodony (neexistuje žádná aminokyselina odpovídající tripletům UAG, UGA a UAA), což způsobuje vazbu terminačního faktoru .
Po replikaci DNA , chyby v transkripci , může dojít během polymerace druhého vlákna z DNA od DNA polymerázy . Tyto chyby, nazývané mutace , může mít důsledky na fenotyp části živé bytosti , zejména pokud se vyskytují v kódujících oblastech jednoho genu . Míra chyb je obecně velmi nízká, v řádu chyby replikace u desítky milionů bází replikovaných prostřednictvím korektury a funkce korektury ( korektury ) DNA polymeráz.
Missense mutace a nesmyslové mutace jsou příklady bodových mutací , které mohou způsobit genetická onemocnění, jako je srpkovitá anémie a thalassemie . Missense které mají významný fyziologický vliv , jsou ty, které vedou ke změně fyzikálně-chemické povahy - například sterickou zábranu , je hydrofilní nebo hydrofobní charakter , je elektrický náboj , na kyselé nebo základní charakter - o zbytek z aminokyseliny důležité pro funkci modifikovaného proteinu. Nesmyslné mutace vedou k předčasnému zavedení stop kodonu do sekvence proteinu, který má být transkribován, což je tím zkráceno, a proto je fyziologická funkce v tkáních obecně změněna.
Mutace, které ovlivňují transkripci pomocí indelů - inzercí a delecí - počtu nukleotidů, které nejsou násobkem 3, odpovídají posunu čtecího rámce . Takové mutace obecně vedou k polypeptidu, který je zcela odlišný od originálu, a to jak v sekvenci přeložených aminokyselinových zbytků, tak v délce produkovaného polypeptidového řetězce, protože poloha stop kodonů se během takové mutace obecně mění. Tyto mutace pravděpodobně způsobí nefunkčnost výsledných proteinů, což je činí velmi vzácnými v sekvencích kódujících proteiny, protože jsou často nekompatibilní s přežitím postiženého organismu. Když k nim dojde, mohou způsobit vážná genetická onemocnění, jako je Tay-Sachsova choroba .
Zatímco drtivá většina mutací, které ovlivňují sekvenci proteinů, jsou škodlivé nebo nedůsledné, některé mohou mít příznivé účinky. Některé z těchto mutací mohou například umožnit, aby organismy, ve kterých se vyskytují, lépe odolávaly stresovým podmínkám prostředí než divoká forma nebo se mohly množit rychleji. Tyto mutace jsou poté upřednostňovány přirozeným výběrem . Tyto RNA viry mají vysokou rychlost mutace, což je výhoda pro ně, které jim umožní neustále vyvíjet a vyhnout se imunitní systém svého hostitele . Ve velkých populacích organismů, které se reprodukují nepohlavně, například v E. coli , může dojít k několika prospěšným mutacím současně; tento jev se nazývá klonální interference a projevuje se v konkurenci mezi těmito různými mutacemi, což často vede k zevšeobecnění jedné z nich na úkor ostatních.
Skutečnost, že 64 kodonů kóduje pouze 22 proteinogenních aminokyselin plus terminační kodony, vede k velmi mnoha nadbytečnostem. To způsobí, že standardní aminokyselina bude kódována v průměru třemi odlišnými kodony - až šesti různými kodony. Mluvíme o synonymních kodonech. Z 20 standardních aminokyselin je pouze methionin a tryptofan kódován pouze jedním kodonem, zatímco asparagin , aspartát , cystein , glutamát , glutamin , histidin , lysin , fenylalanin a tyrosin jsou kódovány dvěma odlišnými kodony, isoleucinem a terminací translace. jsou kódovány třemi odlišnými kodony, threonin , prolin , alanin , glycin a valin jsou kódovány čtyřmi různými kodony a arginin , leucin a serin jsou kódovány šesti kodony. Existuje tedy často několik transferových RNA spojených se stejnou aminokyselinou, schopných vázat se na různé degenerované triplety nukleotidů na RNA. Mluvíme pak o tRNA isoacceptorech, protože přijímají stejnou aminokyselinu.
Použití různých synonymních kodonů pro aminokyselinu daným organismem není náhodné. Obecně pozorujeme, co se nazývá zkreslení použití kódu . Buňka obvykle exprimuje spíše označená preference při výběru synonymních kodonů, takže například, AUA kodon, který kóduje isoleucin je do značné míry zabráněno u lidí stejně jako v Escherichia coli , ve srovnání s dalšími dvěma synonymních kodonů AUU a AUC. Tato preference pro použití kodonů se velmi liší v závislosti na organismu a ve stejném genomu závisí na uvažované frakci ( nukleární , mitochondriální , chloroplastická ). Na druhou stranu je to docela obecné pro všechny geny nesené stejnou částí genomu.
Pokud je genetický kód zdegenerovaný, není to nejednoznačné: každý kodon normálně specifikuje pouze jednu aminokyselinu a jednu. Každá standardní aminokyselina je kódována v průměru třemi různými kodony, takže statisticky jedna mutace ve třech nevede k žádné modifikaci přeloženého proteinu: o takové mutaci se pak říká, že je tichá. Praktickým důsledkem této degenerace je to, že mutace na třetím nukleotidu kodonu obecně způsobí pouze tichou mutaci nebo substituci zbytku jiným, který má stejné hydrofilní nebo hydrofobní , kyselé nebo zásadité vlastnosti , a rovněž sterickou zábranu .
Dalo by se očekávat, že synonymní frekvence kodonů pro danou aminokyselinu budou ekvivalentní, ale naopak studie zjistí prevalenci kodonů (anglicky: codon bias), která má tendenci ovlivňovat konečnou strukturu proteinů. Tato prevalence by také zaznamenala určitou variabilitu mezi řádky.
Biosyntéza proteinů je založena na genetickém kódu . DNA je transkribována do RNA (RNA m ). To je přeložen tím ribozomech , že montáž aminokyseliny přítomné na přenosové RNA (RNA t ). RNA t obsahuje „ antikodon “, komplementární s kodonem, a nese odpovídající aminokyselinový kodon. Specifická esterifikace aminokyseliny odpovídající dané tRNA se provádí aminoacyl-tRNA syntetázami , rodinou enzymů, z nichž každý je specifický pro danou aminokyselinu. Během translace spojuje ribonomová RNA m kodon po kodonu, spojuje kodonovou RNA m s antikodonem RNA t a přidává aminokyselinu nesenou posledně k syntetizovanému proteinu.
V následující tabulce jsou uvedeny standardní význam každého kodonu tří nukleobází z mRNA . Hlavní alternativní kódování jsou označena lomítkem :
1 st báze |
2 nd základny |
3 rd báze |
|||||||
---|---|---|---|---|---|---|---|---|---|
U | VS | NA | G | ||||||
U | UUU | F Phe | UCU | S Ser | UAU | Y Tyr | UGU | C Cys | U |
UUC | F Phe | UCC | S Ser | UAC | Y Tyr | UGC | C Cys | VS | |
UUA | L Leu | UCA | S Ser | UAA | Přestaň okrová | UGA | Zastavit opál /U Sec /W Trp | NA | |
UUG | L Leu / zahájení | UCG | S Ser | UAG | Zastavte oranžovou /O Pyl | UGG | W Trp | G | |
VS | CUU | L Leu | CCU | P Pro | CAU | H Jeho | CGU | R Arg | U |
CUC | L Leu | CCC | P Pro | CAC | H Jeho | CGC | R Arg | VS | |
AUC | L Leu | CCA | P Pro | CAA | Q Gln | CGA | R Arg | NA | |
CUG | L Leu / zahájení | CCG | P Pro | CAG | Q Gln | CGG | R Arg | G | |
NA | AUU | I Ostrůvek | ACU | T Thr | AAU | N Asn | AGU | S Ser | U |
AUC | I Ostrůvek | ACC | T Thr | AAC | N Asn | AGC | S Ser | VS | |
AUA | I Ostrůvek | K tomu | T Thr | AAA | K Lilie | AGM | R Arg | NA | |
SRPEN | M Setkal se a zahájení | ACG | T Thr | AAG | K Lilie | AGG | R Arg | G | |
G | GUU | V Val | GCU | A Do | GAU | D Asp | GGU | G Gly | U |
GUC | V Val | GCC | A Do | GAC | D Asp | GGC | G Gly | VS | |
GUA | V Val | GCA | A Do | GAA | E Lepidlo | GGA | G Gly | NA | |
GUG | V Val | GCG | A Do | GAG | E Lepidlo | GGG | G Gly | G |
Kompaktní způsob reprezentace stejných informací používá jednopísmenné symboly aminokyselin:
Acide aminé : FFLLSSSSYY**CC*WLLLLPPPPHHQQRRRRIIIMTTTTNNKKSSRRVVVVAAAADDEEGGGG Initiation : ···M···············M···············M···························· 1re base : UUUUUUUUUUUUUUUUCCCCCCCCCCCCCCCCAAAAAAAAAAAAAAAAGGGGGGGGGGGGGGGG 2e base : UUUUCCCCAAAAGGGGUUUUCCCCAAAAGGGGUUUUCCCCAAAAGGGGUUUUCCCCAAAAGGGG 3e base : UCAGUCAGUCAGUCAGUCAGUCAGUCAGUCAGUCAGUCAGUCAGUCAGUCAGUCAGUCAGUCAG Reverzní tabulkaProtože každá aminokyselina proteinu je kódována jedním nebo více kodony, je někdy užitečné odkazovat se na následující tabulku; hlavní alternativní kódování je v závorkách uvedeno malými písmeny.
Aminokyselina | Kodony | Zhutněný | |||
---|---|---|---|---|---|
Alanin | NA | Do | GCU, GCC, GCA, GCG. | GCN | |
Arginin | R | Arg | CGU, CGC, CGA, CGG; AGA, AGG. | CGN, MGR | |
Asparagin | NE | Asn | AAU, AAC. | AAY | |
Kyselina asparagová | D | Asp | GAU, GAC. | GAY | |
Cystein | VS | Cys | UGU, UGC. | UGY | |
Glutamin | Q | Gln | CAA, CAG. | PROTOŽE | |
Kyselina glutamová | E | Lepidlo | GAA, GAG. | GAR | |
Wisteria | G | Gly | GGU, GGC, GGA, GGG. | GGN | |
Histidin | H | Jeho | CAU, CAC. | CAY | |
Isoleucin | Já | Ostrůvek | AUU, AUC, AUA. | AUH | |
Leucin | L | Leu | UUA, UUG; CUU, CUC, CUA, CUG. | YUR, CUN | |
Lysin | K. | Lilie | AAA, AAG. | AAR | |
Methionin | M | Se setkal | SRPEN. | ||
Fenylalanin | F | Phe | UUU, UUC. | UUY | |
Prolin | P | Pro | CCU, CCC, CCA, CCG. | CCN | |
Pyrrolysin | Ó | Pyl | UAG, před prvkem PYLIS . | ||
Selenocystein | U | Suchý | UGA se sekvencí SECIS . | ||
Serine | S | Ser | UCU, UCC, UCA, UCG; AGU, AGC. | UCN, AGY | |
Threonin | T | Thr | ACU, ACC, ACA, ACG. | ACN | |
Tryptofan | Ž | Trp | UGG. (UGA) | ||
Tyrosin | Y | Tyr | UAU, UAC. | UAY | |
Valine | PROTI | Val | GUU, GUC, GUA, GUG. | PISTOLE | |
Zahájení | SRPEN. (UUG, CUG) | ||||
Ukončení | * | UAG, UAA; UGA. | UAR, URA |
Kódující oblast mRNA končí stop kodonem . Existují tři stop kodony (UAG, UAA a UGA), které spouštějí zastavení translace ribozomem a uvolnění dokončeného proteinu.
Existence variant v genetickém kódu byla prokázána v roce 1979 genetickým kódem lidských mitochondrií a obecněji mitochondrií obratlovců :
Acide aminé : FFLLSSSSYY**CCWWLLLLPPPPHHQQRRRRIIMMTTTTNNKKSS**VVVVAAAADDEEGGGG Initiation : ································MMMM···············M············ 1re base : UUUUUUUUUUUUUUUUCCCCCCCCCCCCCCCCAAAAAAAAAAAAAAAAGGGGGGGGGGGGGGGG 2e base : UUUUCCCCAAAAGGGGUUUUCCCCAAAAGGGGUUUUCCCCAAAAGGGGUUUUCCCCAAAAGGGG 3e base : UCAGUCAGUCAGUCAGUCAGUCAGUCAGUCAGUCAGUCAGUCAGUCAGUCAGUCAGUCAGUCAGMnoho jiných variant do genetického kódu byly pozorovány od té doby, včetně několika mitochondriálních variant a nepatrnými varianty, jako překladu UGA kodonu tryptofanu spíše než stop kodonu v Mycoplasma a translaci CUG kodonu serinu místo. Než leucin v některých kvasinky jako Candida albicans . Níže uvedená tabulka shrnuje některé důležité varianty genetického kódu:
Kodony z RNA | UGA | CUU | CUC | AUC | CUG | GUG | CGA | CGC | AUU | AUC | AUA | AGM | AGG |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|
Standardní genetický kód | Období | Leu | Leu | Leu | Leu | Val | Arg | Arg | Ostrůvek | Ostrůvek | Ostrůvek | Arg | Arg |
Mitochondrie z obratlovců | Trp | Init | Init | Init | Období | Období | |||||||
Mitochondrie z Ascidians | Trp | Init | Init | Init | Gly | Gly | |||||||
Mitochondrie z kvasnic | Trp | Thr | Thr | Thr | Thr | Břišní svaly | Břišní svaly | Init | |||||
Mitochondrie z bezobratlých | Trp | Init | Init | Init | Ser | Ser | |||||||
Bakterie , archea a plastidy z rostlin | Init | Init | Init | Init |
V rozsahu, v jakém se viry reprodukují pomocí metabolických zdrojů - a tedy genetického kódu - svých hostitelů , je pravděpodobné, že změna genetického kódu ovlivní syntetizované proteiny, a tedy i jejich schopnost reprodukovat; některé viry, jako například rody Totivirus (en) , se tak přizpůsobily změnám v genetickém kódu svého hostitele. V bakterií a archaea , GUG a UUG jsou společné iniciační kodony , ale v některých vzácných případech některé proteiny použít iniciační kodony, které normálně nejsou ty z těchto druhů.
Některé proteiny používají nestandardní aminokyseliny kódované stop kodony v přítomnosti konkrétních sekvencí na messengerové RNA . Stop kodon UGA lze tedy překódovat do selenocysteinu v přítomnosti prvku SECIS, zatímco stop kodon UAG lze překódovat do pyrrolysinu v přítomnosti prvku PYLIS . Na rozdíl od selenocystein, pyrrolysine je spojeno s jeho převodu RNA prostřednictvím vyhrazeného aminoacyl-tRNA syntetázy . Tyto dvě nestandardní aminokyseliny mohou být přítomny ve stejném organismu, ale používají různé způsoby exprese. Archaea, jako je Acetohalobium arabaticum, je schopna v závislosti na podmínkách svého prostředí rozšířit svůj genetický kód z 20 na 21 aminokyselin zahrnutím pyrrolysinu.
Všechny tyto rozdíly zůstávají navzdory všemu okrajové a genetické kódy všech organismů zůstávají v zásadě velmi podobné: jsou založeny na sousedních kodonech tří messengerových RNA nukleotidů, vždy čtených stejným směrem ribozomy, které sestavují proteiny z ' proteinogenní amino kyseliny v pořadí určuje odpovídající antikodon z tRNA na kodony mRNA.
K dispozici je ne méně než 1,5 × 10 84 možností kódování 21 informací (20 standardních aminokyselin + konec překladu) do 64 kodonů , což odpovídá počtu možných kombinací, což umožňuje přidružit 64 kodonů k 21 informační prvky tak, že jakýkoli kodon a jakýkoli informační prvek je spojen s alespoň jednou kombinací. Navzdory tomuto astronomicky velkému počtu jsou všechny genetické kódy všech známých forem života téměř totožné a jsou omezeny na malý počet menších variací. Důvody pro takovou všeobecně pozorovanou homogenitu zůstávají v zásadě neznámé, i když byly k vysvětlení této situace formulovány různé hypotézy. Jsou v zásadě čtyř typů:
Distribuce kodonů přiřazených aminokyselinám navíc není náhodná. To je vidět na seskupení aminokyselin do sousedních kodonů. Dále, aminokyseliny, které sdílejí metabolickou dráhu z biosyntézy společného, mají tendenci mít stejný první báze nukleové kyseliny v jejich kodonech, zatímco ty, jejichž postranní řetězec má vlastnosti, fyzikálně-chemické podobný sklon také mít podobné kodony, které účinek omezení důsledků bodové mutace a chyby překladu . A konečně, teorie vysvětlující původ genetického kódu by měla odrážet také následující pozorování: