Tyto databáze bibliografické répertorient kterákoliv třída objektů bibliografické knihy, sbírky, recenze, články z časopisů přes jejich metadat , jako je jeho titul , autor, abstraktní, předmět deskriptor. Jsou výsledkem elektronizace z katalogů knihoven a umožnit vyhledávání pomocí klíčových slov , stejně jako analýzu dat ( Bibliometrie , atd.) WorldCat je příkladem takové databáze.
Bibliografické databáze nebo přesněji bibliografické referenční databáze byly vytvořeny od 60. let.
V letech 1960-70 je termín databanka privilegovaný. Poté určí databáze, které v té době často obsahují bibliografické odkazy, týkající se „definované oblasti znalostí a uspořádané tak, aby byly nabízeny konzultacím uživatelů“. Tento termín umožnil odlišit tyto dokumentární systémy od samotného softwaru nebo systémů správy databází (DBMS).
Bibliografické databáze se vyvíjely, zejména od dvacátých let 20. století, ve dvou osách, které lze kombinovat:
Zde používaný termín databáze je třeba chápat opatrně. Jedná se spíše o soubor dat nebo bibliografické záznamy. Tato zdánlivě jednoduchá struktura může skrýt faktory složitosti.
Struktura záznamů může být relativně elementární (jednoduchá kolekce polí), složitější s formáty MARC (nebo v souladu s normou ISO 2709 ) a nyní libovolná struktura s XML .
Ve srovnání s relačními databázemi vychází faktor složitosti z nemožnosti zmrazit velikost dat. Téměř všechna pole mají proměnlivou délku s opakujícími se faktory, které mohou být velmi velké. Například jméno autora má v průměru méně než 10 znaků, ale existují autoři s více než 100 znaky. Vědecký článek má v průměru 2 nebo 3 autory, ale lze najít články o fyzice s 500 autory.
Mnoho bibliografických databází obsahuje informace popisující obsah pomocí seznamu pojmů rejstříku nebo klíčových slov. Tato klíčová slova často patří do terminologických úložišť, jejichž povaha je proměnlivá: jednoduchý seznam kontrolovaných slov, klasifikační plán, dokumentární tezaurus nebo ontologie .
Kromě indexování může velké množství dat odkazovat na specializovaná úložiště, jako jsou názvy periodik nebo přidružení.
A konečně, některé databáze také kódují odkazy na bibliografii zpracovávaných článků, jako je Science Citation Index, a bibliografická databáze se poté stává vlastním úložištěm.
Podle vybraných témat jsou definovány také bibliografické databáze. Mohou značně ovlivnit strukturu báze (například v biologických vědách kodifikace genů).
Základna je také definována svým pokrytím nebo přesněji způsobem, jakým je základna vytvořena. V mnoha případech (Medline, Pascal) je pokrytí definováno souborem recenzí, které jsou systematicky analyzovány.