Tyto biologické databáze jsou knihovny, které jsou uvedeny informace o biologických věd shromážděných prostřednictvím vědeckých experimentů publikované literatury, experimentální technologie širokopásmových a počítačové analýzy. Obsahují informace z různých oblastí výzkumu, jako je genomika , proteomika , metabolomika , fylogenetika a DNA čipy . Mezi obsahem databází najdeme informace o funkci, struktuře, lokalizaci ( buněčných a chromozomálních ) genůa klinické účinky jejich mutací , jakož i jejich podobnosti v sekvenci a struktuře.
Tyto databáze jsou důležitým nástrojem pro vědce, protože jim umožní pochopit a vysvětlit mnoho biologických jevů v rozmezí od struktury biomolekul a jejich interakcí na celý metabolismus organismu, a dokonce i vývoj z druhů . Tyto znalosti usnadňují zvládání patologických stavů, umožňují tvorbu nových léků a umožňují objevování mezidruhových vztahů v celé historii života.
Znalosti z biologie jsou předmětem všech druhů specializovaných nebo obecných databází. V důsledku toho je někdy obtížné zajistit konzistenci informací. Cílem Integrativní bioinformatiky je vyřešit tento problém poskytnutím jednotného přístupu. Pojem přístupové číslo v bioinformatice umožňuje vzájemné propojení obsahu různých databází.
Pro pochopení biologických databází jsou důležité pojmy relační databáze (pocházející z informatiky ) a vyhledávání informací (v elektronických knihovnách ). Jejich design, vývoj a dlouhodobá údržba jsou klíčovou oblastí bioinformatiky . Často se popisuje jako polostrukturovaná data a může mít podobu tabulek , struktur XML atd.
Časopis Nucleic Acids Research (NAR) vydává každý rok speciální vydání s názvem The Database Issue of NAR , které je volně dostupné. Kategorizuje velkou část online databází dostupných veřejnosti, které se týkají biologie a bioinformatiky . Toto vydání doprovází The Online Molecular Biology Database Collection , seznam 1380 databází. Existují i další kolekce databází, například MetaBase nebo Sbírka odkazů na bioinformatiku .
Většina biologických databází je přístupná na webových stránkách, kde mohou uživatelé procházet informace. Obecně je také možné stahovat data v různých formátech: text, sekvenční data, proteinové struktury nebo odkazy. Například :
U některých druhů, zejména u těch, které se často používají pro výzkum, existují specializované databáze. Colibase se například věnuje E. coli . Nalezli jsme také FlyBase pro Drosophila , WormBase pro hlístice C. elegans a C. briggsae , EuPathDB pro eukaryotické patogeny .