Databáze umožňuje ukládat a načítat strukturovaná, semi-strukturovaná nebo hrubá data nebo informace , často spojené s tématem nebo činností; mohou mít různou povahu a mohou být víceméně vzájemně propojeny.
Jejich data mohou být uložena ve velmi strukturované formě ( například relační databáze ) nebo ve formě nestrukturovaných nezpracovaných dat (například s databázemi NoSQL ). Databáze může být umístěna na stejném místě a na stejném počítačovém médiu nebo rozložena na několik strojů na několika místech.
Databáze je ve středu počítačových systémů pro shromažďování, formátování, ukládání a používání informací . Zařízení obsahuje systém pro správu databáze (zkratka: SGBD ): software stroje, který manipuluje s databází a řídí přístup k jejímu obsahu. Mezi taková zařízení patří také aplikační software a soubor pravidel týkajících se přístupu a používání informací.
Jedním z nejběžnějších použití počítačů je manipulace s daty . Databáze se používají například v odvětví financí , pojišťovnictví , školství , epidemiologie , veřejné správy (včetně statistik) a médií .
Pokud je několik objektů zvaných „databáze“ spojeno do kolekce, nazývá se to databáze .
Databáze je „kontejner“, ve kterém jsou uložena data, jako jsou čísla, data nebo slova, která mohou být znovu zpracována počítačovými prostředky za účelem získání informací; například čísla a jména sestavená a tříděná do adresáře . Přepracování je obvykle kombinací operací hledání, výběru, řazení, seskupení a zřetězení .
Jedná se o ústřední část informačního systému nebo databázového systému (nebo jednoduše databáze ), který řídí sběr, ukládání, přepracování a použití dat. Toto zařízení často obsahuje software motoru (viz další odstavec), aplikační software a soubor pravidel týkajících se přístupu a používání informací.
Systém správy databáze je sada programů, které manipulují se strukturou databáze a směřují přístup k datům v ní uloženým. Databáze je tvořena sbírkou souborů; přistupuje k němu prostřednictvím systému DBMS, který přijímá požadavky na manipulaci s obsahem a provádí nezbytné operace se soubory. Skrývá složitost operací a nabízí syntetický pohled na obsah. DBMS umožňuje několika uživatelům současně manipulovat s obsahem a může nabízet různé pohledy na stejnou sadu dat.
Použití databází je alternativou k tradiční metodě ukládání dat, při které aplikace umisťuje data do souborů manipulovaných aplikací. Usnadňuje sdílení informací, umožňuje automatickou kontrolu konzistence a nadbytečnosti informací, omezení přístupu k informacím a snadnější produkci souhrnných informací ze surových informací. Databáze má také sjednocující účinek: v komunitě využívající databázi organizuje jedna osoba - správce databáze - obsah databáze způsobem, který je přínosný pro celou komunitu., Který se může vyhnout konfliktům kvůli konkurenčním zájmům mezi členové komunity.
Databáze obecně vyžaduje více místa na disku, široká škála funkcí nabízených systémem DBMS činí zpracování složitějším a selhání má širší dopad a je obtížnější jej obnovit.
Použití dat se u jednotlivých databází liší. Databáze lze klasifikovat podle počtu uživatelů, typu obsahu, zejména pokud je slabě nebo silně strukturovaný, a podle použití databáze, zejména provozního využití, nebo pro analytické účely. účely :
Databáze lze klasifikovat podle počtu uživatelů - jedné, malé skupiny nebo dokonce společnosti. Na osobní počítač je nainstalována kancelářská databáze pro službu jednoho uživatele. Zatímco podniková databáze je nainstalována na výkonném počítači sloužícím stovkám uživatelů. Centralizovaná databáze je nainstalována na jednom místě, zatímco „ distribuovaná databáze “ je rozložena na více místech.
Nejpopulárnějším způsobem klasifikace databází je podle jejich použití a časového aspektu obsahu:
operační základny nebo OLTP ( online zpracování transakcí ) jsou určeny k tomu, aby pomohly uživatelům sledovat denní aktivity. Umožňují zejména okamžitě ukládat informace týkající se každé operace prováděné v rámci dané činnosti: nákupy, prodeje, rezervace, platby. V takových aplikacích je kladen důraz na rychlost odezvy a schopnost zpracovávat více transakcí současně. analytické základy známé také jako OLAP (z anglického online analytického zpracování ) jsou složeny z historických informací, jako jsou měření, na nichž se provádějí rozsáhlé operace za účelem získání statistik a předpovědí . Databáze jsou často datové sklady (anglicky datawarehouse ), databáze používaná ke každodennímu shromažďování obrovského množství historických dat pro operační databázi. Obsah databáze se používá k provádění analýz časového vývoje a statistik, které se používají při správě . V takových aplikacích je kladen důraz na schopnost provádět velmi složité zpracování a motorový software (DBMS) je v zásadě analytickým motorem .Databáze jsou také někdy klasifikovány podle charakteristik obsahu:
Tyto pevné disky , mass storage o velké kapacitě, byly vynalezeny v roce 1956 . Vynález pevného disku umožnil používat počítače ke shromažďování, klasifikaci a ukládání velkého množství informací flexibilnějším a efektivnějším způsobem než předchozí médium: magnetická páska .
Termín databáze se poprvé objevil v roce 1964 a označoval soubor informací sdílených různými uživateli vojenského informačního systému.
První hierarchické databáze se objevily na počátku 60. let . Informace byly rozděleny do dvou úrovní hierarchie: jedna úroveň obsahovala informace, které jsou identické v několika záznamech v databázi. Výřez byl poté rozšířen, aby měl podobu stromového diagramu.
V roce 1965 navrhl Charles Bachman architekturu Ansi / Sparc, která se používá dodnes. V roce 1969 vytvořil síťový datový model v rámci konsorcia CODASYL pro počítačové aplikace, pro které hierarchický model není vhodný. Charles Bachman obdržel Turingovu cenu v roce 1973 za „vynikající příspěvky k databázové technologii“.
V roce 1968 vytvořil Dick Pick Pick , operační systém obsahující „vícehodnotový“ systém správy databáze (MV RDBMS).
V roce 1970 , Edgar F. Codd je uvedeno v jeho matematické práce na relační algebře , že množina entit je srovnatelná s rodinou definující vztah matematiky a že se připojí nejsou pravoúhlé produkty . Tato práce je u zrodu relačních databází. Edgar F. Codd obdržel Turingovu cenu v roce 1981 .
Model sdružení entit vynalezl Peter Chen v roce 1975 ; má objasnit organizaci dat v relačních databázích.
V roce 1990 byla v Belgii spuštěna legální databáze LEADERS s měsíčními aktualizacemi na počítačích klientů, nejprve na disketách a následně na CD-ROM (odpovědný za René Janray). V roce 2000 byla prodána společnosti Kluwer. Mezitím shromáždilo téměř 1 000 zákazníků, včetně nejdůležitějších obchodů a společností. Závěrečná disertační práce na ISAT se zaměřila na tento produkt a měla název The Leaders Database: A Breakthrough in the World of Electronic Legal Publishing . V roce 1998 vydavatel MARABOUT v knize věnované databázím věnoval celou kapitolu databázi LEADERS.
V relačním modelu označuje relace všechny informace v tabulce, zatímco asociace v modelu přidružení entity označuje logický odkaz, který existuje mezi dvěma tabulkami obsahujícími související informace.
První databáze byly založeny na prezentaci děrných štítků : rozdělených do řádků a sloupců pevné šířky. Taková distribuce ztěžuje ukládání programovacích objektů ; zejména neumožňují dědičnost mezi entitami, charakteristickou pro objektově orientované programování .
Objektově relační databáze, které se objevily v 90. letech , používají relační datový model a umožňují ukládání objektů. V těchto databázích se přidružení dědičnosti objektů přidávají k přidružení mezi entitami relačního modelu.
Klíčovými fázemi životního cyklu databáze jsou návrh a uvedení do provozu.
Před návrhem jsou uživatelé a producenti informací dotazováni, aby se seznámili s charakteristikami informací, vztahy mezi informacemi a charakteristikami počítačového systému, který bude databázi hostovat. Cílem tohoto kroku je shromáždit charakteristiky informací v praxi a potřeby uživatelů a formulovat je jednoduchým způsobem, srozumitelným pro uživatele i pro správce databáze.
Poté bude vytvořen celkový diagram informační a relační sítě ve formě diagramu zahrnujícího entity, atributy a vztahy. Existují různé metody modelování dat, nejznámější je DCM ( Conceptual Data Model ). To umožňuje zejména vytvořit strukturovaný diagram všech dat informačního systému, srozumitelný všem jeho aktérům (produktový manažer, vývojář, zákazník, pokud je informován…).
Tento plán se poté transformuje na pokyny formulované v příkazovém jazyce DBMS a pokyny se provedou za účelem vytvoření struktury databáze a jejího zprovoznění.
Definování vnitřní organizace databáze - jejího fyzického datového modelu - je posledním krokem v její konstrukci. Tato operace spočívá především v definování záznamů odpovídajících logickému datovému modelu. Záznamy jsou uloženy v souborech a každý soubor obvykle obsahuje dávku podobných záznamů. Během tohoto kroku se používají různé techniky, aby se získal model, jehož výsledkem je adekvátní rychlost manipulace s daty, přičemž je zaručena integrita dat.
Kvalita fyzického datového modelu má zásadní vliv na rychlost databázových operací. Jednoduché vylepšení může datové operace 50krát zrychlit, což je o to znatelnější, když je k dispozici velké množství dat. Na počátku 21. století existovaly databáze obsahující několik terabajtů (10 12 ) dat a nezávislé inženýry, jejichž úkolem bylo pouze pomáhat zákazníkům urychlit jejich databáze.
Jakmile jsou monitorovací operace funkční, umožňují detekovat problémy, které mohou vyžadovat úpravy schématu. Změny lze provést také v případě změny potřeb uživatele.
Interní organizace databáze - její fyzický datový model - zahrnuje záznamy odpovídající logickému datovému modelu, ukazatele a značky používané systémem DBMS k vyhledání a manipulaci s daty. Záznamy jsou uloženy v souborech a každý soubor obvykle obsahuje dávku podobných nahrávek. Interní organizace používá různé techniky zaměřené na dosažení odpovídající rychlosti při manipulaci s daty při zajištění integrity dat.
Logická organizace dat je nezávislá na jejich fyzické organizaci. To znamená, že pozici dat v souborech lze zcela změnit, aniž by byla ovlivněna jejich organizace ve formě záznamů v tabulkách. Systém DBMS organizuje soubory způsobem, který zrychluje operace a liší se v závislosti na hardwaru a operačním systému, pro který je systém správy databáze navržen. Záznamy jsou obvykle seskupeny do klastrů (anglický klastr ), jejichž velikost je sladěna s optimální velikostí pro hardware ( pevné disky ).
Hlavními technikami používanými ve fyzickém datovém modelu jsou indexy, materializovaná zobrazení a dělení. Ukládání dat často provádějí zařízení RAID a DBMS používá techniky, jako jsou hash tabulky, stromy B, bitmapy nebo soubory ISAM:
Index Index je soubor údajů určený k urychlení vyhledávání dat operace. Struktura indexu zahrnuje hodnoty spojené s ukazateli, kde každý ukazatel umožňuje najít data, která mají tuto hodnotu. Zhmotněné zobrazení V materializovaném zobrazení je výsledek vyhledávání / agregace uložen do databáze, což umožňuje jeho opakované použití a šetří čas. Tato technika se používá zejména v analytických databázích a aplikacích OLAP . Rozdělení na oddíly V dělicí techniky , správce databáze distribuuje data mezi několik pevných disků, které urychluje operace snížením množství práce prováděné každý pevný disk. RAID (z anglického redundantního pole levných disků ) V technice RAID hardwarové zařízení distribuuje data mezi několik pevných disků, což zrychluje operace a předchází ztrátě informací v případě poruchy. Toto hardwarové zařízení používá software jako běžný pevný disk ; Hash tabulka (v anglickém hashování ) V této organizaci se hash funkce používá k transformaci jakékoli hodnoty na celé číslo pomocí aritmetického výpočtu. Získané číslo se používá k určení přesného umístění, kde budou data této hodnoty uložena. Strom B. Hřídel B je struktura stromu , kde všechny větve mají stejnou délku, a každý uzel má mezi N / 2 a N větví. Toto je struktura velmi často používaná pro indexy. Rastrový obrázek Bitmapové indexy se často používají pro data, kde existuje jen několik možných hodnot (příklad: pohlaví M / F, den v týdnu atd.). Pro každou z možných hodnot počátečního bodu obsahuje index tabulku bitů, kde je N-tý bit na „1“, pokud má N-tý počátek příslušnou hodnotu. ISAM ( metoda indexovaného sekvenčního přístupu ) V této organizaci jsou záznamy ukládány seřazené podle primárního klíče ve struktuře rozdělené na válce a stopy pevné velikosti. Každá stopa má volné místo, které umožňuje vkládání nových nahrávek. Stromová struktura obsahuje hodnotu klíče a ukazatel na první záznam každé stopy. Noviny Protokol obsahuje seznam posledních operací provedených na databázi. Tento protokol je používán databázovým strojem k vrácení operací zpět, například v případě selhání počítače nebo pokud operace obsahují chybu. Viz také IT transakce .Systém správy databází je sada softwaru, který manipuluje s obsahem databází. Používá se k provádění běžných operací, jako je vyhledávání, přidávání nebo mazání záznamů ( vytváření , čtení , aktualizace , mazání zkrácených CRUD ), manipulace s indexy , vytváření nebo kopírování databází).
Cílem mechanismů systému správy databází je zajistit konzistenci, důvěrnost a trvanlivost obsahu databází. Software odmítne umožnit uživateli upravovat nebo mazat informace, pokud k tomu nebyl dříve oprávněn; odmítne, aby uživatel přidal informace, pokud existují v databázi a jsou předmětem pravidla jedinečnosti ; také odmítne ukládat informace, které nejsou v souladu s pravidly konzistence, jako jsou pravidla referenční integrity, v relačních databázích.
Systém správy databáze automaticky přizpůsobuje indexy s každou provedenou změnou v databázi a každá operace je zapsána do protokolu obsaženého v databázi, což umožňuje zrušit nebo ukončit samotnou operaci v případě havárie počítače a zaručit tak konzistenci obsah databáze.
Od roku 2009 jsou hlavními systémy správy databází na trhu IBM DB2 , Oracle Database , MySQL , PostgreSQL a Microsoft SQL Server .
Databáze jsou stále častěji zpřístupňovány uživatelům na serverech, přes internet nebo na místních serverech pro optimální zabezpečení. Přístup je víceméně bezpečný.
Někteří producenti dat (zejména místní úřady) zpřístupňují některé ze svých databází všem zdarma. Data, která jsou právně vlastníky nebo správci s oprávněním k distribuci (například fotografie), mohou být v tomto případě přístupná na základě bezplatné licence (ex CC-BY-SA ), nebo někdy celá databáze sama o sobě může být přístupná na základě bezplatné licence licence ( například ODBL ). Tyto licence umožňují zachovat duševní vlastnictví obsahu a zároveň autorizovat opakované použití a transformaci s uvedením zdroje. Existuje mnoho dalších, více či méně omezujících licencí.
Jedním z nejběžnějších použití počítačů je manipulace s daty. Finanční, pojišťovací, vzdělávací, veřejná správa a mediální odvětví, hlavní odvětví informační společnosti , která poskytují informační služby, používají databáze. Mezi praktické oblasti použití patří inventář (zásoby, obchody, knihovny), rezervační nástroje (lety letadlem, kino atd.), Licence (řízení, lov, majitel psa) ...), lidské zdroje, mzdy, průmyslová výroba ( výrobní stroje jsou často automatizovány), jakož i účetnictví a fakturace.
Počítačové aplikace pro sběr administrativních informací, jako jsou lékařské záznamy, daňové záznamy nebo povolení k nošení zbraní, využívají databáze.
V počítačové počítačové aplikaci na prodej jízdenek se cestovní nebo koncertní lístky zaznamenávají do databáze.
V účetním nebo pokladním softwaru se položky i účtová osnova zaznamenávají do databáze; zpráva je zpráva získat automatickou syntézou obsahu databáze. Podobně se do databáze ukládá počítačová aplikace řízení výroby pomocí počítače (Rep. POAG), stav zásob, dostupnost personálu a čas a poskytuje základ pro zprávu o plánování.
V softwaru pro lékařskou diagnostickou pomoc je soubor patologií a diagnóz zaznamenán do databáze. Vyhledávač extrahuje diagnóz, které nejlépe odpovídají patologií zvolené uživatelem.
Schengenský informační systém je databázová aplikace ze strany policie a celní služby použitých schengenského prostoru v Evropě, shromažďovat a vyměňovat si soudní informace (zatykač, otisky prstů, zákazy pobytu ...).
ITIS je počítačová aplikace, která obsahuje katalog taxonomie živých druhů (rostlin, zvířat, hub, mikroorganismů atd.).
CIA , zpravodajská agentura ve Spojených státech, má jednu z největších databází na světě.
Katalog online knihkupectví amazon.com je jednou z největších databází na světě s katalogizací více než 250 milionů knih. Amazon.com také vlastní databázi filmů IMDb .
Knihovny, zejména univerzitní knihovny, poskytují svým divákům přístup do databází. Obvykle se jedná o databáze obsahující digitální knihy nebo články z obecného nebo specializovaného tisku poskytované externími poskytovateli služeb. Například knihovna National School of Information Sciences and Libraries ( enssib ) nabízí svým uživatelům přístup k 76 databázím, včetně A až Z (tisk), Cairn (tisk a elektronické knihy), Dawsonera (elektronické knihy), Électra (bibliografická databáze) atd. Některé mají otevřený přístup a jsou bezplatné, jiné mají přístup pouze na místě, jiné mají přístup na dálku a na dálku. Kromě toho škola (enssib) vytváří a uvádí do provozu své vlastní databáze, aby lépe sloužila komunitě profesionálů v informačních vědách a knihovnách: Francouzská základna pro budování knihoven od roku 1992 , Stáž a nabídka pracovních míst de l'enssib, Base Maguelone: Databáze typografických ozdob.
V geografických informačních systémech se mapovací informace zaznamenávají do databáze. Informace o mapování oblohy jsou k dispozici v hvězdných katalozích .
V diskusním nebo e-mailovém softwaru jsou zprávy často ukládány do databáze.
Antivirový software často používá databázi, ve které jsou uloženy otisky prstů zanechané počítačovými viry .
Registr je databáze, která obsahuje nastavení konfigurace v operačních systémech Windows . Object Data Manager je databáze podobná AIX operační systémy .
V softwaru pro správu elektronických dokumentů jsou elektronické dokumenty ukládány do databáze. V systému pro správu obsahu jsou části webové stránky uloženy v databázi a v softwaru elektronického obchodování jsou to reklamy i inzerenti.
Na platformě e-learningu jsou cvičení, zkoušky, učební plány a adresář učitelů a studentů uloženy v databázi.
ERP jako jsou SAP ERP (od společnosti SAP AG ) se skládá ze sady softwaru, který všichni používají stejné databáze. Různé programy, jako jsou tyto produkty, se vztahují k běžným obchodním operacím, jako je fakturace , účetnictví , plat , sledování objednávek a zásob .