V IT je zálohování ( zálohování v angličtině) operace spočívající v duplikování a zabezpečení dat v počítačovém systému . Někteří uživatelé mají konečný cíl uložit své soubory ihned po uložení, například ten, kdo právě zadal legální text do textového editoru.
Tento pojem je třeba odlišit od dvou podobných konceptů:
Záloha nutně zahrnuje uložení dat, ale ne nezbytně pro účely archivace.
Doporučuje se sdělit uživatelům propracovaný a písemný postup pro strategii zálohování a archivace.
Upozornit zasažené uživatele, když se zálohování nezdaří.
Provádět pravidelné testy obnovy dat ve vhodnou dobu, aby bylo možné překonat možný problém během obnovy dat požadovaný uživatelem.
Kopie zabezpečení jsou užitečné především pro dvě věci:
Nejběžnější technikou je kopírování dat na médium nezávislé na původním systému ( lokální počítač , server atd.).
Zpětná operace opětovného použití zálohovaných dat se nazývá obnovení .
Volba techniky zálohování vyžaduje zohlednění:
Existuje také možnost výběru dat, která se mají uložit. A konečně, u velkých záložních systémů je třeba vzít v úvahu fyzická kritéria: fyzický objem paměťového média, hmotnost, citlivost na teplotu, vlhkost, prach a světlo.
Rozlišuje se mezi zálohováním jednotlivé stanice a zálohováním serveru. Oba se týkají stejného typu informací (počítačová data) a mají stejný cíl (chránit informace a umožnit jejich vyhledání v případě ztráty), ale metody zálohování se liší. Z několika důvodů:
Ve skutečnosti zůstává zálohování dat jednotlivých pracovních stanic ve strategii pro používání počítačů okrajové. Společnosti však zobecněním používání mikropočítačů a sdílením síťových zdrojů pociťují potřebu zabezpečení, které upřednostňuje vývoj zálohovacích nástrojů na mikropočítačích, které si postupně získávají svět osobních mikropočítačů.
Záloha je součástí globálnějšího přístupu, který spočívá v zajištění kontinuity činnosti počítačového systému nebo v případě poruchy v jeho co nejrychlejším restartu. Tento proces je často formalizován v dokumentu, který může nést různá jména, například Plán obnovy po katastrofě (PRA) nebo nouzový plán , a který vyžaduje buď automatické mechanismy (např. Upozornění v případě výpadku napájení nebo ztráty přístupu) k paměťové jednotce) nebo ruční zásahy (např. výměna vadných magnetických pásek). Trend směřuje k automatizaci, o které se v nouzových situacích říká, že je bezpečnější než manuální operace.
Pokud jde o média, servery vždy vyžadovaly velká úložná média. Páska již dlouho hlavním prostředkem, díky svému velkému objemu, nízké náklady (ve srovnání s jinými médii), jeho schopnost opětovného použití a jeho relativní stability s časem a opotřebením. Pak přišly digitální kazety (magnetické pásky integrované v plastovém pouzdře, jako jsou DAT , DLT , SDLT , LTO ), pevné disky a nověji optická média, přepisovatelná či nikoli, například CD-R, DVD-R nebo podobné formáty.
V letech 1975–1995 spojovala většina uživatelů osobních počítačů pojem „zálohování“ především s vytvářením kopií na diskety. S vývojem lépe vybavených mikropočítačů přijali osobní uživatelé efektivnější média: optické disky (CD-ROM nebo DVD), USB klíče . Stejně tak počítače integrují stále pokročilejší funkce zálohování, například:
Se širokopásmovým připojením a širokopásmovým připojením k internetu se stává samozřejmostí , stále více uživatelů se obrací k tomuto typu zálohovací služby. Můžeme rozlišit dvě metody:
Online zálohováníDnes se stávají populární takzvané „online“ záložní kopie. Skládají se z připojení k internetové stránce zvané „ Cloud “ a přenosu vašich dat tam. Existuje mnoho výhod:
Na trhu zálohování dat vyjadřují společnosti a správy specifická očekávání vůči hráčům na trhu, takže se prioritně obracejí na integrátory, vydavatele záložních řešení, dodavatele dat. Hardwarovou infrastrukturu a poskytovatele služeb outsourcingu zálohování nebo dokonce poskytovatelům pokrývajícím celé spektrum odborných znalostí v oblasti zálohování i vzdálených služeb.
Hlavní nevýhodou používání těchto řešení je to, že nechávají svá data k dispozici třetí straně, která je může konzultovat, upravovat, duplikovat, publikovat nebo obchodovat s nimi, nebo je dokonce znepřístupnit (v případě bankrotu převzetí stránek konkurencí nebo obchodní spor s hostitelem). Je zřejmé, že smluvní ustanovení regulují tato rizika, ale nemohou zabránit hostiteli v technickém jednání škodlivým způsobem. Jedno z řešení zneužívajících konzultací spočívá v šifrování dat.
Další nevýhoda pochází z omezení uložených nebo načtených dat: k řízení používání svých disků a šířky pásma může hostitel smluvně omezit svého zákazníka na konzultovaný objem úložiště nebo dat, nad kterým blokuje přístup k datům.
Při používání tohoto procesu online zálohování je důležité pamatovat na tato kritéria:
Vývoj metod výměny souborů umožnil po určitou dobu zálohování v režimu „ peer-to-peer “. Tato technika je založena na spolupráci, kde každý chrání svá data v úložných prostorech ostatních.
Existuje mnoho výhod:
Hlavní nevýhodou této techniky je, že je určena pouze pro jednotlivce. Nesplňuje potřeby podniků. Je třeba dbát na to, aby byla data plně šifrována, aby byla nečitelná v úložných prostorech jiných lidí. Tato technika musí být součástí důvěryhodných skupin.
Nejjednodušší metodou je úplná nebo úplná záloha (nazývaná také „úplná záloha“); spočívá v kopírování všech dat, která mají být uložena, ať jsou aktuální, stará, upravená či nikoli.
Tato metoda je také nejspolehlivější, ale je dlouhá a velmi drahá, pokud jde o místo na disku, což jí brání v praktickém použití pro všechny zálohy, které mají být provedeny. Z důvodu úspory rychlosti a času existují metody, které ukládají pouze data upravená a / nebo přidaná mezi dvě celkové zálohy. Existují dva:
Obnova disku pomocí jedné z těchto metod je delší a zdlouhavější, protože kromě obnovení rozdílové zálohy nebo přírůstkových záloh musíte také obnovit poslední úplnou zálohu. Soubory mezitím odstraněné budou nebo nebudou obnoveny (v závislosti na funkčnosti použitého zálohovacího softwaru)
Abychom pochopili rozdíl mezi těmito dvěma metodami, vezmeme si příklad plánu zálohování podle následujícího cyklu:
Aby bylo možné odlišit tyto různé metody zálohování / archivace (úplné, přírůstkové, rozdílové), zavedeným mechanismem je použití značky pro archivaci. Každý soubor má tuto značku archivu, která je při vytváření nebo úpravách souboru nastavena na „true“. Tuto pozici můžeme chápat jako „Právě jsem byl upraven nebo vytvořen: Jsem připraven k archivaci, takže jsem nastavil značku na true“. Tato značka se také nazývá archivační atribut (nebo archivační bit). V systému Windows lze tento atribut upravit a lze jej zobrazit pomocí příkazu ATTRIB (atribut A pro archiv). Zálohovací systém může také vytvořit databázi obsahující definice souborů a použít interní označení.
Během úplné zálohy nastavíme atribut souboru na „0“, abychom si zapamatovali skutečnost, že soubor byl uložen.
Technický detailBěhem úplné zálohy se zálohují všechny soubory bez ohledu na polohu značky (true nebo false). Jakmile je soubor archivován, je mu přiřazena pozice jeho značky (archivní bit) na „false“ (nebo na „0“).
Obnovení z tohoto typu zálohy vyžaduje zkopírování poslední úplné zálohy a nejnovější rozdílové zálohy na disk.
V našem příkladu, pokud se obnovení týká celého disku, který byl zálohován v den D + 2, musíme poté na disk znovu kopírovat úplnou zálohu dne D a rozdílovou zálohu dne D + 2, abychom měli nejnovější verzi Data.
Pokud však jde o obnovení souboru nebo adresáře, který byl zálohován v den D + 2, je užitečná pouze poslední záloha, zde rozdíl.
Technický detailBěhem rozdílové zálohy jsou zálohovány všechny soubory označené „true“. Jakmile je soubor archivován, udržuje si pozici značky jako před uložením.
Některý zálohovací software poskytuje možnost použít nikoli archivní bit, ale dobu úpravy souboru k určení, zda je soubor vhodný pro zálohu.
Příklad: úplná záloha se provádí v den J. V den D + 1 se přírůstkové zálohování provádí odkazem na den J. V den D + 2 se přírůstkové zálohování provádí odkazem na den D + 1. A tak dále.
Pokud je obnovení na úplném disku, který byl zálohován v den D + 4, musí být na den zkopírována záloha dne D a přírůstkové zálohy dnů D + 1, D + 2, D + 3 a D +. 4 získáte nejnovější verzi všech dat.
Pokud však jde o obnovení souboru nebo adresáře, který byl zálohován v den D + 3, je užitečná pouze poslední záloha, zde přírůstková.
Inkrementální zálohování se také může týkat pouze upravených bajtů souborů, které se mají zálohovat. Toto se označuje jako přírůstkové zálohování bajtů. Tato metoda umožňuje optimalizovat využití šířky pásma nejvíce. Umožňuje zálohovat soubory několika gigabajtů, protože na zálohovací platformu se pokaždé přenese jen malé procento svazku.
Pokud byl soubor odstraněn ze systému souborů, měla by přírůstková záloha zaznamenat, že tento soubor, který byl přítomen během předchozí zálohy, by měl být při obnově této přírůstkové zálohy odstraněn, aby byl systém souborů obnoven přesně do původního stavu. . Tento bod není vždy brán v úvahu zálohovacím softwarem, který spravuje přírůstkové zálohy. Obnovení z přírůstkových záloh pomocí softwaru, který nezvládá mazání souborů, pak vede k rekonstituci původního systému souborů znečištěného všemi soubory, které byly někdy dávno smazány.
Technické údajeBěhem přírůstkové zálohy jsou zálohovány všechny soubory označené „true“. Jakmile je soubor archivován, je mu přiřazena pozice jeho „falešného“ markeru.
Zálohování, archivace a uchováníDíky zachování je rozdíl mezi zálohováním a archivací.
Doba uchování je doba, během které jsou zálohovaná data zachována neporušená a přístupná. Pokud je krátký, jedná se o klasickou zálohu: data jsou chráněna proti jejich zmizení / změně. Pokud je dlouhá (jeden nebo více let), jedná se o archivaci, jejímž účelem je najít data se zárukou, že nebyla pozměněna nebo zfalšována.
Příklad: Uchovávání na čtyři týdny znamená, že data zálohovaná k určitému datu budou stále k dispozici až 28 dní po zálohování. Po těchto 28 dnech logicky již data v záložním systému neexistují a jsou považována za nevystopovatelná. Fyzicky mohou být stopy použité k uložení této zálohy vymazány.
Čím delší uchování, tím větší počet instancí zálohovaných pro stejný objekt souboru nebo složky, což vyžaduje vhodný systém vyhledávání a indexování, a tím více místa bude potřeba k uložení výsledků zálohování.
Vzorec pro výpočet potřebného záložního prostoruTento vzorec se používá ke zvětšení velikosti záložní knihovny (páska nebo disk VTL).
V případě klasické zálohy, tj. Celkové zálohy o víkendech (pátek večer) a přírůstkové zálohy v ostatní pracovní dny v týdnu, od pondělí do čtvrtka (nikoli v pátek), tj. Čtyři dny:
- nechť D je užitečný datový prostor k uložení,
- nebo R požadované retenční období pro práci, vyjádřené v týdnech,
- nechť T je denní míra modifikace souborů v prostoru, který má být uložen,
získá se následující vzorec: D x R + (D x T%) x 4 = záložní kapacita.
Kvantifikovaný příklad: Celkem 100 GB k zálohování s retencí 3 týdny a míra modifikace 20% denně dává 100 x 3 + (100 x 20%) x 4 = 380 GB. K zálohování bude potřeba 380 GB navýšení našich 100 GB dat se zachováním 3 týdnů a změnou 20% denně.
Technologické inovace, jako jsou snímky nebo deduplikace , umožňují snížit tuto hodnotu velmi zajímavým způsobem.
Na rozdíl od přírůstkové zálohy, kde je nejstarší záloha úplná a následné rozdílové, spočívá princip dekrementální zálohy v získání úplné zálohy jako nejnovější zálohy a rozdílové zálohy pro nejstarší.
Výhoda spočívá ve skutečnosti, že úplná obnova systému v jeho nejnovějším stavu je jednoduchá a rychlá, používá se pouze poslední záloha (na rozdíl od přírůstkové metody, která zahrnuje obnovu nejstaršího (úplného) než všech následujících , přírůstkové). Pokud nyní chceme obnovit systém ve stavu předposlední zálohy, musíme obnovit poslední zálohu (úplnou), pak předchozí (nazývanou „dekrementální“, protože dává rozdíl, který se má použít v systému souborů k dosažení stavu N -1 ze stavu N). Další výhodou je, že recyklace záložního úložného prostoru je jednoduchá, protože spočívá v odstranění nejstarších záloh, zatímco v případě přírůstkových záloh zahrnuje recyklace obvykle několik sad záloh (plné + přírůstkové).
Nevýhodou tohoto přístupu je, že vyžaduje více manipulace s daty s každou zálohou, protože musíte vytvořit novou zálohu s každou novou zálohou a transformovat nejstarší starou zálohu (což byla tedy úplná záloha) na zálohu.
Zálohování dat lze provést pomocí více či méně sofistikovaných technik. Nejjednodušší metodou je procházení adresářů a souborů na pracovní stanici nebo serveru . Ale rychle zjistíte, že jste omezeni počtem souborů a objemem dat, které mají přímý dopad na čas zálohování. Chcete-li obejít tato omezení, je možné několik přístupů: