Sekvenování DNA je určit pořadí sekvence nukleotidů fragmentu DNA dané.
Sekvence DNA obsahuje informace, které živé bytosti potřebují k přežití a reprodukci. Stanovení této sekvence je proto užitečné jak pro výzkum zaměřený na poznání života organismů, tak pro aplikované subjekty. V medicíně jej lze použít k identifikaci, diagnostice a potenciálnímu nalezení léčby genetických chorob a virologie . V biologii se studium sekvencí DNA stalo důležitým nástrojem pro klasifikaci druhů .
Sekvenování DNA bylo vynalezeno ve druhé polovině 70. let. Dvě metody byly vyvinuty nezávisle, jednu týmem Waltera Gilberta ve Spojených státech a druhou metodou Fredericka Sangera (v roce 1977) ve Velké Británii . Tyto dvě metody jsou založeny na diametrálně odlišných principech: Sangerův přístup je metodou selektivní enzymatické syntézy , zatímco Maxamův a Gilbertův přístup je metodou selektivní chemické degradace . Za tento objev dostali Gilbert a Sanger v roce 1980 Nobelovu cenu za chemii .
Zpočátku Sangerova metoda vyžadovala dostupnost jednořetězcové DNA, která sloužila jako templát pro enzymatickou syntézu komplementárního řetězce. Z tohoto důvodu je prvním biologickým organismem, jehož genom byl sekvenován v roce 1977, bakteriofágový virus φX174 . Tento virus má tu vlastnost, že má genom vytvořený z jednořetězcové DNA, která je zapouzdřena ve virové částici.
Za posledních 25 let byla Sangerova metoda široce vyvinuta díky několika důležitým technologickým pokrokům:
Metoda Maxama a Gilberta vyžaduje toxická chemická činidla a zůstává omezená, pokud jde o velikost fragmentů DNA, které může analyzovat (<250 nukleotidů). Méně snadné robotizace, jeho použití se nyní stalo důvěrným.
Tato metoda se běžně používá k provádění sekvenování malých bodů. Pro sekvenování celého genomu se místo toho používá sekvenování nové generace. Princip této metody spočívá v zahájení polymerace DNA pomocí malého oligonukleotidu (primeru) komplementárního k části fragmentu DNA, který má být sekvenován. Prodloužení primeru se provádí Klenowovým fragmentem ( DNA polymeráza I bez aktivity 5 '→ 3' exonukleázy) a udržuje se termostabilními DNA polymerázami , které se používají pro PCR . Přidají se čtyři deoxyribonukleotidy (dATP, dCTP, dGTP, dTTP) a také nízká koncentrace jednoho ze čtyř dideoxyribonukleotidů (ddATP, ddCTP, ddGTP nebo ddTTP).
Tyto dideoxyribonukleotidy fungují jako "jedy" terminátoru řetězce: jakmile jsou začleněny do nového syntetizovaného řetězce, zabraňují dalšímu prodloužení, protože nemají 3'-OH konec (místo hydroxylu pouze vodík). K tomuto ukončení dochází konkrétně na úrovni nukleotidů odpovídajících dideoxyribonukleotidu začleněnému v reakci. Pro úplné sekvenování stejného fragmentu DNA se tato reakce opakuje čtyřikrát paralelně se čtyřmi různými dideoxyribonukleotidy.
Například v reakci, do které byl přidán ddGTP, se syntéza zastaví na úrovni G. Reakční směs obsahující jak dGTP, tak trochu ddGTP, dojde ke statistickému ukončení v závislosti na tom, zda DNA polymeráza používá některý z těchto nukleotidů. To má za následek směs fragmentů DNA s rostoucí velikostí, které všechny končí na jednom z G v sekvenci. Tyto fragmenty jsou poté odděleny elektroforézou na polyakrylamidovém gelu , což umožňuje identifikovat polohu Gs v sekvenci.
Takto syntetizované fragmenty jsou detekovány začleněním indikátoru do syntetizované DNA. Zpočátku byl tento indikátor radioaktivní; dnes se používají fluorescenční stopovací látky, připojené buď k oligonukleotidu, nebo k dideoxyribonukleotidu.
Tato metoda je založena na chemické degradaci DNA a používá různé reaktivity čtyř bází A, T, G a C k dosažení selektivního štěpení. Rekonstrukcí pořadí řezů se můžeme vrátit zpět k nukleotidové sekvenci odpovídající DNA. Toto chemické sekvenování lze rozdělit do šesti po sobě následujících kroků:
Znalost celé struktury genomu může projít jeho sekvenováním. Vzhledem k tomu, že velikost genomů je několik milionů bází (nebo megabází), je nutné spojit přístupy molekulární biologie s přístupy počítačové vědy, aby bylo možné zpracovat tak velké množství dat.
Používají se dva hlavní principy sekvenování celého genomu. V obou případech je genomová DNA předem fragmentována enzymatickými ( restrikčními enzymy ) nebo fyzikálními ( ultrazvukem ) metodami :
Hlavní rozdíl mezi těmito dvěma principy spočívá v tom, že hierarchické sekvenování se pokouší srovnat sadu velkých klonů (~ 100 kb), zatímco v celkové metodě je celý genom redukován na malé fragmenty, které jsou sekvenovány a poté srovnány.
Po extrakci je genomová DNA štěpena ultrazvukem na fragmenty o velikosti 50 až 200 kb a poté klonována do vhodného vektoru, jako jsou bakteriální umělé chromozomy nebo BAC. Počet klonů by měl umožňovat pokrytí 5 až 10násobkem celkové délky studovaného genomu. Překrytí a uspořádání klonů se provádí buď hybridizací specifických sond, nebo analýzou restrikčních profilů , nebo častěji uspořádáním po sekvenování a hybridizaci konců BAC. Po objednání klonů jsou fragmentovány a sekvenovány jednotlivě, poté sestaveny bioinformatickým srovnáním.
Výhodou této metody je větší snadnost sestavení fragmentů díky překrytí BAC, možnost porovnání fragmentů s dostupnými databázemi a možnost sdílení práce se sekvenováním mezi několika laboratořemi, z nichž každá má na starosti chromozomální oblast.
Hlavní nevýhodou je obtížnost klonování fragmentů obsahujících opakované sekvence, které jsou velmi časté v určitých genomech, jako jsou například u savců, což ztěžuje konečnou bioinformatickou analýzu.
Jedná se o metodu sekvenování genomové DNA, která byla původně vyvinuta v laboratoři Fredericka Sangera v Cambridge na konci 70. let za účelem sekvenování prvních genomů virů.
Tuto metodu popularizoval Craig Venter pro sekvenování velkých genomů, zejména v rámci společnosti Celera Genomics . První aplikací bylo sekvenování bakteriálních genomů, poté genomu Drosophila a nakonec lidského a myšího genomu . K provedení úplného sekvenování genomu pomocí této techniky jsou vytvořeny dvě až tři knihovny složené z náhodných fragmentů genomové DNA . Mezi knihovnami se fragmenty liší jak ve velikosti, tak v lokalizaci na genomu . Z těchto knihoven je mnoho klonů sekvenováno a poté sestaveno. Celková sekvence se získá zpracováním všech knihoven pomocí bioinformatických nástrojů, zarovnáním fragmentů pomocí překrývajících se sekvencí.
Výhodami oproti sekvenování hierarchickým sekvenováním jsou rychlost techniky a nižší náklady. Nevýhodou je, že počítačové zpracování neumožňuje srovnat fragmenty obsahující velké opakované sekvence, které jsou často přítomny v genomech savců.
Tato metoda se běžně označuje jako brokovnice (odpalovaná brokovnice) nebo brokovnice s celým genomem (WGS). Tato metafora ilustruje náhodnou povahu počáteční fragmentace genomové DNA: celý genom je nastříkán, podobně jako pelety tohoto typu střelné zbraně jsou rozptýleny.
Sekvenování hybridizací je založeno na použití DNA čipů obsahujících několik stovek (pro čipy první generace) až několik tisíc oligonukleotidů. DNA, která má být analyzována, je rozřezána na několik fragmentů, které jsou poté inkubovány na čipu, kde budou hybridizovat s oligonukleotidy, ke kterým jsou komplementární. Čtení čipu (detekce hybridizovaných oligonukleotidů) umožňuje získat spektrum sekvence DNA , to znamená její složení v subsekvencích n nukleotidů, kde n je velikost sond na použitém čipu. Počítačové zpracování spektra pak umožňuje rekonstruovat celou sekvenci.
adaptace Sangerovy techniky, která místo radioaktivity používá fluorescenci . Inkorporované dideoxynukleotidy jsou specificky značeny fluorescenčními molekulami nebo „ fluorochromními “ fluorofory (ddATP-JOE, ddCTP-5-FAM, ddGTP-TAMRA a ddTTP-ROX).
Sekvenční reakce se provádí pomocí PCR . Taq polymerázy provádí prodloužení při začlenění dideoxynukleotidu značeného fluorescencí. Syntetizované fragmenty se poté oddělí elektroforézou .
Automatické zařízení provede sekvenční reakci a vstřikuje ji do kapiláry obsahující polyakrylamidový polymer . Během migrace detekuje laserový optický systém fluorescenci procházející před laserovým okénkem, která je emitována ddNTP, který fragment ukončí excitací (zelené světlo pro JOE „ddATP“, modré pro 5-FAM „ddCTP“, žluté pro TAMRA „ddGTP“ a červená pro ROX „ddTTP“.
Oddělením těchto molekul elektroforézou podle jejich velikosti lze číst postupná písmena, která se objevují ve formě křivek na elektroferogramu (nebo fluorogramu ), jehož fluorescence odpovídá základně tohoto zakončujícího ddNTP. Analytický software umožňuje dosáhnout shody mezi fluorescenčními křivkami a začleněným nukleotidem.
Informace se zaznamenávají elektronicky a interpretovaná sekvence se ukládá do databáze počítače. O tomto typu sekvenování se říká, že má vysokou propustnost, protože lze provádět mnoho sekvencí současně. Skutečně, v závislosti na modelech sekvenceru, 1, 6, 12 nebo dokonce 36 kapilár může pracovat paralelně s vědomím, že automat může postupně injektovat 96 sekvenčních reakcí obsažených v destičce do každé z kapilár. Délka přehrávání je přibližně 1 kB na sekvenci. Doba běhu sekvence je asi 10 minut. Za jednu noc, s 12 kapilárami, může sekvencer automaticky získat hodnotu 1 Mb.
Porovnání metod sekvenování nové generaceMetoda | Délka čtení | přesnost | Čtení podle zkušeností | zažít čas | náklady na 1 milion základen (v USD) | Výhody | Nevýhody |
---|---|---|---|---|---|---|---|
Sekvenování jedné molekuly v reálném čase (Pacific Biosciences) | 10 000 bp až 15 000 bp v průměru (14 000 bp N50); maximální délka čtení> 40 000 základen | 87% | 50 000 na buňku nebo 500–1 000 megabází | 30 minut až 4 hodiny | 0,13–0,60 $ | dlouhé čtení. Rychle. Detekuje 4mC, 5mC, 6mA | mírný průtok, zařízení může být velmi drahé |
Iontový polovodič ( sekvenční iontový torrent ) | až 400 bp | 98% | až 80 milionů | 2 hodiny | 1 $ | nejlevnější a nejrychlejší vybavení | chyby homopolymeru |
Pyrosekvenování ( 454 ) | 700 bp | 99,9% | 1 milion | 24 hodin | 10 $ | dlouhé a rychlé čtení | experiment je drahý, chyby homopolymeru |
Sekvenování syntézou (Illumina) | 50 až 300 bp | 99,9% | až 6 miliard | 1 až 11 dní | 0,05 až 0,15 USD | Vysoký potenciál propustnosti sekvence, v závislosti na modelu řadiče a požadované aplikaci | Zařízení může být velmi drahé. Vyžaduje vysoké koncentrace DNA. |
Ligové sekvenování (SOLiD sekvenování) | 50 + 35 nebo 50 + 50 bp | 99,9% | N / A | 20 minut až 3 hodiny | 2400 $ | dlouhé čtení. Užitečné pro mnoho aplikací. | Dražší a nepohodlnější pro velké sekvenční projekty. Tato metoda také vyžaduje čas na klonování plazmidu nebo krok PCR. |
Příjmení | Počet strojů (celosvětově) |
---|---|
Illumina HiSeq 2000 | 5490 |
Analyzátor genomu Illumina 2x | 411 |
Skála 454 | 382 |
ABI SOLID | 326 |
Ion Torrent | 301 |
Illumina MiSeq | 299 |
Ion Proton | 104 |
Pacific Biosciences | 50 |
Oxford Nanopore MinION | 14 |
Illumina NextSeq | 3 |
Nanopore sekvenování je metoda vyvíjená od roku 1995 pro sekvenování DNA.
Nanopór je jednoduše malá díra s vnitřním průměrem řádově 1 nanometr. Některé porézní transmembránové buněčné proteiny fungují jako nanodráty, nanopóry byly také vyrobeny leptáním o něco větší díry (několik desítek nanometrů) v kusu křemíku.
Teorie za sekvenováním nanopórů je následující: Když je nanopór ponořen do vodivé tekutiny a je na něj aplikován potenciál (napětí), lze pozorovat elektrický proud v důsledku vedení iontů nanopórem. Množství proudu je velmi citlivé na velikost a tvar nanopóru. Pokud jednotlivé nukleotidy (báze), řetězce DNA nebo jiné molekuly procházejí nanopórem nebo v jeho blízkosti, může to způsobit charakteristickou změnu velikosti proudu nanopórem.
Brzy v druhé polovině XX th století, poměr humánní medicíně se stále dominuje vůle pochopit a léčit choroby a různých hrozeb pro organizaci. Pochopení toho, jak to funguje, se však v posledních desetiletích velmi prohloubilo, zejména díky zdokonalení a vzhledu různých technik. Samotný koncept zdraví, což znamená spíše absenci patologie, byl přirozeně předefinován, aby od nynějška znamenal pocit celkového blaha jednotlivce, fyzického i morálního. Demokratizovaly se tak nové obchodní strategie, které každému jednotlivci nabízejí možnost péče o jeho vlastní fyzickou integritu. (léky bez lékařského předpisu, zdravé jídlo atd.).
Sekvenování DNA je technika v samém srdci této nové definice pojetí zdraví a vztahu k „živým věcem“ obecně, protože navrhuje optimální a individuální léčbu pro každého člověka. Trh s genetickými daty se od svého vzniku velmi rychle rozvíjel a četné investice vedly k velmi prudkému poklesu cen.
První kompletní sekvenování lidského genomu byl dokončen v roce 2003 a trvalo asi deset let práce, s celkovou investici ve výši 2,7 miliardy $. V té době byla stále ještě často používána Sangerova metoda k dešifrování přibližně 3 miliard párů nukleotidů, které tvoří naši DNA. Poté se objevilo mnoho projektů (zejména 1000 Génomes , ENCODE …) a byly vyvinuty nové stroje (zmíněné výše) s cílem generovat kompletní sekvenci lidského genomu za méně než 1000 dolarů. Se zlepšením metod sekvenování byla cena částečného sekvenování lidského genomu ve vysoké kvalitě odhadnuta na 14 milionů dolarů v roce 2006, což je relativně levnější ve srovnání s projektem dokončeným v roce 2003. Na konci roku 2015 byla cena za generování jediná série se pohybovala kolem 1 500 $.
S nástupem těchto nových mnohem efektivnějších metod, seskupených pod zkratkou NGS , rychlejší a méně nákladné, explodoval trh sekvenování DNA a dnes je k dispozici mnoho aplikací v různých oblastech. Některé společnosti, jako je Illumina, nyní nabízejí službu sekvenování DNA, která je finančně dostupná jednotlivcům.
Sekvenování DNA lze použít ke stanovení sekvence jednotlivých genů, velkých genetických oblastí, úplných chromozomů nebo celých genomů jakéhokoli organismu. Sekvenování DNA se stalo klíčovou technologií v mnoha oblastech biologie a dalších věd, jako je medicína, forenzní lékařství nebo antropologie .
V molekulární biologii umožňuje sekvenování genomu studium kódovaných proteinů , vědci identifikují změny v genech a spojují je s určitými chorobami, aby se zaměřili na potenciální léky.
Sekvenování umožnilo pochopit genetický původ určitých druhů rakoviny, které vznikají v důsledku akumulace mutací v kritických genech, které modifikují normální programy buněčné proliferace, diferenciace a smrti. RAS-Raf-MEK-ERK-MAP kinázy zahrnuje buněčné odpovědi na růstové signály a v asi 15% rakoviny u lidí je gen RAS mutována způsobuje onkogenní formu.
Vzhledem k tomu, že DNA je informativní makromolekula z hlediska přenosu z generace na generaci, používá se sekvenování DNA v evoluční biologii ke studiu toho, jak různé organismy souvisejí a jak se vyvíjely, a to na základě společných studií mezi paleogenetiky a antropology. Analýza DNA lidských tkání, zejména kostí a zubů, pohřbených na nekropolách, umožňuje definovat haploskupiny a odhadnout jejich biogeografický původ i migrační cesty, kterými se mohli vydat před stovkami či tisíci lety, k porovnání jejich genetické vlastnosti s těmi současných populací, nebo zjistit některé z jejich fyzických vlastností. Kvůli poklesu ceny za sekvenování genomu společnosti nabízejí veřejnosti jako placenou službu ke sledování původu člověka z jednoduché soupravy k použití doma.
Lékařští genetici mohou u pacientů sekvenovat geny, aby určili, zda existuje riziko genetických onemocnění. Jedná se o vyšetření genetických vlastností člověka. Diagnóza je obvykle prenatální nebo postnatální. Například prenatální diagnostika může odhalit dědičné onemocnění způsobené vážným zdravotním postižením nebo poruchami chování a psychickými poruchami a dát rodičům, jejichž dítě je diagnostikováno, možnost volby, zda bude pokračovat v těhotenství. Informace o genetických variacích ( polymorfismy s jedním nukleotidy ) také vedou terapeutické řízení a umožňují genetické poradenství pro členy rodiny.
Vyšetření genetických charakteristik se stále častěji provádí vysoce výkonným sekvenováním DNA (NGS). Obecně se v současnosti spíše sekvenují pouze kódující části genů, ve kterých jsou popsány 2/3 mutací. NGS proto umožňuje sekvenovat všechny kódující části genů člověka najednou, což se nazývá exome .
V prenatální diagnostice se DPNI zavádí jako bezpečná a včasná detekční technika pro Downov syndrom nebo jiné chromozomální abnormality nebo dokonce určité bodové mutace. Není to diagnóza, ale pouze screening. Spočívá v odběru krve matce během těhotenství. Tato krev přirozeně obsahuje malé množství fragmentů DNA z plodu a genetici ji nemohou oddělit od fragmentů DNA patřících matce, které se také nacházejí v krvi. DPNI je tedy vysoce výkonné sekvenování všech fragmentů DNA cirkulujících v mateřské krvi, pak počítačová analýza výsledků. DPNI znamená prenatální screening neinvazivní technikou. V závislosti na výsledcích je indikováno potvrzení abnormality, které zahrnuje amniocentézu .
Reprodukční medicína je obor medicíny, který studuje fyziologii reprodukce, její patologii a neplodnost. Cílem tohoto přístupu k medicíně je zlepšit reprodukční zdraví.
Sekvenování DNA, zejména pohlavních buněk, umožnilo pochopit genetické modifikace způsobující nerovnováhu v plodnosti. Uvažuje se o budoucí genetické léčbě zaměřené na prevenci dědičných onemocnění, například trizomie 21 je způsobena neexprese genu odpovědného za inaktivaci chromozomu X během oplodnění. Bioetické otázky však vyvstávají nad zpracováním DNA pro plodení.
Vysoce výkonné sekvenování také vstoupilo do oblasti lékařské mikrobiologie. Například v bakteriologii, i když lze ve dvou vzorcích od různých pacientů nalézt stejný bakteriální druh (např. Staphylococcus aureus ), nemusí to nutně být přímý přenos z pacienta na pacienta. Ve skutečnosti jsou pod stejnými bakteriálními druhy seskupeny mnohé velmi odlišné kmeny, a proto mají různé genomy. Sekvenování celého genomu umožňuje například určit, jak odlišné jsou tyto genomy, kvantifikací počtu mutací ( SNP ) mezi organismy. Během přímého přenosu bakterie z jednoho pacienta na druhého je proto počet rozdílových mutací velmi nízký.
Celkově může být vysoce výkonné sekvenování celých bakteriálních genomů užitečné pro:
DNA člověka může být přenesena kontaktem s předměty nebo s lidmi. Tato DNA pochází z buněk z různých matric, krve, spermií, vlasových prvků, epiteliálních buněk. (Sekvenování DNA lze použít s metodami profilování DNA pro forenzní identifikaci a testování otcovství. Je však třeba poznamenat, že test otcovství nemá ve Francii žádnou právní hodnotu. Pouze pokud byl nařízen soudcem.