Proteinová doména je částí proteinu , který je schopen přijmout strukturu samostatně nebo částečně samostatně od zbytku molekuly. Jedná se o modulární prvek struktury proteinů, který se tak může skládat ze sestavy několika z těchto domén. Toto se nazývá protein více domén.
Proteinové domény obecně tvoří kompaktní a stabilní strukturu a někdy je lze produkovat samostatně (genetickým inženýrstvím, proteolytickým štěpením atd.). Mohou nést určité specifické funkce kompletního proteinu: vazbu ligandů , interakci s jinými makromolekulami, katalytické místo atd.
Daná proteinová doména je obecně charakterizována svou trojrozměrnou strukturou a určitým počtem aminokyselin konzervovaných v její primární struktuře. Stejná proteinová doména může být přítomna v různých proteinech (viz obrázek) s různými funkcemi. Tato modulární organizace proteinů do domén je jednou z pák molekulární evoluce, která umožňuje jejich použití v kombinaci jako stavebních kamenů pro tvorbu široké škály proteinů.
Definice proteinové domény je tedy formulována kolem tří konceptů: základní jednotka struktury , základní jednotka funkce , základní jednotka skládání .
Typická velikost proteinové domény se pohybuje mezi 30 a 500 aminokyselinami, v průměru kolem sto aminokyselin.
Existenci meziproduktů při skládání každého z proteinových monomerů prokázal Michel Goldberg v roce 1969, který označil jako „globuly“ tyto oblasti polypeptidových řetězců, které se skládají autonomně, kolem nukleačních center. Nezávislé, před vývojem úplné terciární struktury bílkoviny. V roce 1973 navrhl podobný model Donald B. Wetlaufer pod názvem „doména“, což byl termín, který byl nakonec přijat.
Existuje velká rozmanitost proteinových domén, ale přesto omezenější než u celých proteinů. Některé odhady uvádějí údaj pouze několika tisíc možných struktur pro globulární doménu. Můžeme rozpoznat opakující se prvky v architektuře těchto domén, což umožnilo provést klasifikaci.
Některé domény jsou velmi časté a vyskytují se ve velmi mnoha proteinech. Motiv rozpoznání RNA nebo RRM domény byl tedy nalezen v sekvencích ne méně než 928 proteinů kódovaných v lidském genomu .