Internetový archiv | |
Servery v zrcadle byly uchovávány v Bibliotheca Alexandrina | |
Tvorba | 1996 |
---|---|
Zakladatelé | Podívejte se na tabuli |
Právní forma | Nezisková organizace |
Heslo | Univerzální přístup ke všem znalostem |
Ústředí | 300 Funston Avenue, Richmond District , San Francisco , Kalifornie USA |
Směr | Julien masanes |
Aktivita | Archivace a uchování webu |
produkty | Archiv obálek ( d ) |
Partneři | Digitální veřejná knihovna v Americe |
Efektivní | 200 |
webová stránka | archive.org |
Obrat | 14 000 000 USD (2015) |
Internet Archive (nebo IA ) je nezisková organizace zabývající se archivací webů, která funguje také jako digitální knihovna . Tyto elektronické archivy jsou tvořeny snímky (kopie stránek pořízených v různých časech) webových stránek, softwaru, filmů, knih a zvukových záznamů.
Aby byla zajištěna stabilita a bezpečnost archivovaných dat , je v egyptské Bibliotheca Alexandrina udržováno funkční zrcadlové místo . AI zpřístupňuje své sbírky badatelům, historikům a akademickým pracovníkům zdarma. Nachází se v okrese Richmond , jižně od Presidia v San Francisku , je členem Americké knihovnické asociace a stát Kalifornie jej oficiálně uznává jako knihovnu .
Webový prohledávač používaný IA je Heritrixem , svobodný software . Bezplatným softwarem pro skenování knih je Scribe.
Internet Archive byla založena v roce 1996 tím, Brewster Kahle . Vzhledem ke svým cílům - zachování lidských znalostí a přístupnost sbírek pro všechny - zakladatelé IA porovnávají tento projekt se starším z Alexandrijské knihovny .
Wayback Machine je snímek součástí webu vyvinutého Internet Archive . Wayback Machine vytvořil Brewster Kahle pro ukládání a indexování čehokoli na webu. Stroj Wayback je aktualizován o obsah od Alexy . Tato služba umožňuje uživatelům prohlížet archivované verze webových stránek v průběhu času: jedná se o „trojrozměrný index“.
Snímky jsou k dispozici šest až dvanáct měsíců po pořízení. Četnost snímků se liší, ne všechny aktualizace webových stránek se zaznamenávají a mohou být dodrženy intervaly několika týdnů.
V roce 2006 obsahoval Wayback Machine téměř dva petabajty dat. Objem roste tempem 20 terabajtů za měsíc, což je nárůst o dvě třetiny z dvanácti terabajtů za měsíc, což byla míra růstu v roce 2003. Tento růst je větší než množství textu obsaženého v nejdůležitějších knihovnách svět, včetně Kongresové knihovny . V roce 2009 obsahoval Wayback Machine téměř tři petabajty dat a jeho nárůst činil 100 terabajtů za měsíc. Data jsou archivována v systémech vyráběných firmou Capricorne Technologies, stojany Petabox.
Název „ Wayback Machine “ odkazuje na epizody The Rocky and Bullwinkle Show , kde pan Peabody, profesorský pes a jeho asistent Sherman (lidský mazlíček), používají k popisu slavných historických událostí stroj času s názvem „WABAC Machine“.
V roce 2015 by Rusko omylem zablokovalo celý web Wayback Machine .
Uživatelé, kteří chtějí trvale a okamžitě archivovat svá data, mohou být při předplatném použity ve službě Archive-It (en) IA. Shromážděná data jsou pravidelně indexována Wayback Machine . vprosince 2007, tato služba vytvořila více než 230 milionů adres URL pro 466 veřejných sbírek, včetně vládních agentur, univerzit a kulturních institucí.
Příklad organizací nebo institucí účastnících se Archive-It:
Kromě webových archivů udržují služby Internet Archive velké sbírky digitálních médií, která jsou buď ve veřejné doméně, nebo jsou licencována pro další distribuci, například licence Creative Commons . Média jsou organizována ve sbírkách podle typu (pohyblivé obrázky, zvuk, text atd.) A v dílčích sbírkách podle různých kritérií. Každá hlavní sbírka obsahuje dílčí sbírku Společenství , kde lze archivovat příspěvky od široké veřejnosti.
Jeho sbírky zahrnují (od 14. listopadu 2007):
Kromě celovečerních filmů obsahuje videonahrávka internetového archivu novinky, klasiku komiksů , pro a protiválečnou propagandu a pomíjivější materiál z archivu Prelinger, jako jsou reklamy, vzdělávací a průmyslové filmy a amatérské filmové sbírky.
Příklady sběru:
Příklad francouzského filmu:
ZvukyZvuková sbírka se skládá z hudby, audioknih, vysílání zpráv, starých rozhlasových pořadů a široké škály dalších zvukových souborů. Dílčí sbírka Live Music Archive obsahuje 40 000 nahrávek koncertů nezávislých umělců a také zavedenější umělce a hudební soubory s méně přísnými pravidly pro nahrávání koncertů, jako je Grateful Dead .
TextyTato sbírka sdružuje texty z projektu Gutenberg , texty z různých knihoven po celém světě a také sbírku dokumentů a poznámek z ARPANET . S více než 7 miliony knih je internetový archiv po Knihách Google druhou největší otevřenou knihovnou digitálních knih na světě. Všechny dokumenty digitalizované a poskytované online uživateli internetu nebo institucemi jsou oerizovány a převedeny do souborů EPUB pro e-čtečky nebo MOBI pro Kindle a mají trvalou archivaci na mnoha serverech po celém světě (Kalifornie, Egypt, Čína, Nizozemsko). Punčochy atd. ).
Knihovna Sainte-Geneviève je první francouzskou knihovnou, která se na projektu podílelabřezna 2010. Ve Francii École des Ponts ParisTech (odSrpna 2012), Národní institut zemědělského výzkumu (od ledna 2015), Sciences Po Paris (od června 2015), Interuniversity Health Library (od ledna 2018), Univerzitní knihovna jazyků a civilizací (od září 2019) a také knihovny École normale supérieure (od prosince 2020).
Internet Archive je členem Open Content Alliance (in) a provozuje Open Library, kde je online a k tisku k dispozici více než 200 000 digitalizovaných knih ve veřejné doméně. Tomuto účelu slouží systém skenování knih Scribe .
Během pandemie koronavirů zpřístupňuje Internetový archiv Američanům knihy chráněné autorskými právy, aby mohli během vězení studovat. Několik vydavatelů nesouhlasí a internetový archiv odnímá přístup k příslušným knihám16. června 2020. Navzdory všemu vydavatelé tento web žalují a zkušební verze je naplánována na rok 2021.
Na konci roku 2002 internetový archiv vymazal různé stránky kritické vůči scientologii identifikované Wayback Machine. Chybová zpráva uvádí, že k tomu došlo na základě „požadavku od vlastníka webu“. Později bylo objasněno, že právníci Scientologické církve požadovali odstranění, a to bez jakéhokoli právního důvodu, a že vlastníci těchto stránek nechtěli jejich stránky odstranit.
v října 2004, v případě nazvaném „ Telewizja Polska SA vs Echostar Satellite “ se právník pokusí použít archiv Wayback Machine jako zdroj přípustných důkazů, pravděpodobně vůbec poprvé.
Telewizja Polska je poskytovatelem TVP Polonia a EchoStar provozujících síť Dish Network . Před zkouškou společnost EchoStar uvedla, že má v úmyslu použít snímky ze stroje Wayback Machine jako důkaz minulého obsahu ze stránky Telewizja Polska. Telewizja Polska podala v limine (in) návrh na odstranění spravedlivých výstřelů z doslechu a neověřeného zdroje, ale soudce Arlander Keys odmítl tvrzení Telewizja Polska a odmítl vyloučit důkazy v procesu. V době soudního řízení však soudce okresního soudu Ronald Guzman v prvním stupni vyvrátil zjištění soudce Keyse a dospěl k závěru, že ani internetový archiv, ani související stránky (tj. Stránka Telewizja Polska) nejsou jako důkaz přípustné. Soudce Guzman rozhodl, že tisk webové stránky nebyl důkazem autentizace informací.
Healthcare Advocates, Inc.V roce 2003 byla společnost Healthcare Advocates, Inc. obviněna ze soudního sporu o porušení ochranné známky. Stíhání se pokusilo použít archivovaný internetový materiál přístupný prostřednictvím internetového archivu. Poté, co společnost tento soudní spor prohrála, se pokusila žalovat internetový archiv za porušení zákona DMCA a zákona o počítačových podvodech a zneužívání . Argumentovali tím, že protože si na svůj web nainstalovali soubor robots.txt , měl se mu robot AI vyhnout. První stížnost byla podána dne26. června 2003a přidali soubor robots.txt, soubor 8. července 2003, stránky budou zpětně staženy. Soud byl urovnán mimosoudně.
Soubor Robots.txt se používá jako součást standardu Robots Exclusion Standard , což je dobrovolný standard, který uplatňuje IA a který robotům zakazuje indexovat určité stránky označené tvůrcem jako mimo hranice. Výsledkem je, že AI odstranila řadu webů, které jsou nyní prostřednictvím Wayback Machine nepřístupné. To je někdy způsobeno novým vlastníkem, který umístil soubor robots.txt zakazující indexování webu. Správci tvrdí, že pracují v systému, který umožní přístup k předchozím archivům a vylučuje položky vytvořené po přidání souboru.
V roce 2006 IA aplikovala pravidlo Robots.txt zpětně. Pokud web blokuje IA, jako jsou Healthcare Advocates, budou odstraněny také všechny stránky dříve archivované z této domény. V případě blokovaných webů se archivuje pouze soubor robots.txt. Tato praxe se zdá být škodlivá pro výzkumné pracovníky, kteří mají přístup k informacím dostupným v minulosti.
IA však také uvádí, že „někdy nás majitel webových stránek kontaktuje přímo a žádá nás, abychom přestali indexovat nebo archivovat web. Těmto požadavkům vyhovujeme. Vysvětlili také, že „Internetový archiv nemá zájem na zachování nebo poskytnutí přístupu na webové stránky nebo k jinému internetovému materiálu ve vlastnictví lidí, kteří by nechtěli, aby byl jejich materiál archivován . “
Patentové právoUnited States Patent Office a s výhradou dodatečných požadavků plněny (např. Poskytuje oficiální prohlášení od archiváře) je Evropský patentový úřad bude přijímat pocházející z Internet Archive jako doklad o zveřejnění webové stránky. Tato data se používají k určení, zda je webová stránka k dispozici před datem podání patentové přihlášky.
v listopadu 2005, bylo z webu odstraněno bezplatné stahování koncertů Grateful Dead . John Perry Barlow označil za podněcovatele této změny Boba Weira , Mickey Hart a Billa Kreutzmanna . The30. listopadu, Je příspěvek na Brewster Kahle je přečíst si shrnout, co se zdá být kompromis dosažený mezi členy kapely. Živé koncerty lze stáhnout nebo poslouchat a nahrávky budou k dispozici pouze pro poslech. Od té doby byly přidány koncerty.
Suzanne ShellThe 12. prosince 2005, aktivistka Suzanne Shell (ne) požadovala částku 100 000 dolarů za archivaci svého webu „profane-justice.org“ v letech 1999 až 2004.20. ledna 2006„Internetový archiv podal deklaratorní žalobu v okrese severní Kalifornie a požádal soud, aby zjistil, že společnost IA neporušila autorská práva společnosti Shell.
Společnost Shell odpověděla a podala další stížnost na společnost IA za archivaci svých stránek s údajným porušením jejích podmínek služby. The13. února 2007, okresní soudce v Coloradu zamítl všechny žaloby kromě porušení smlouvy.
The 25. dubna 2007Společnosti IA a Shell společně oznámily urovnání svého sporu. IA řekl: „Internetový archiv nemá žádný zájem na vkládání informací do Wayback Machine, který používají lidé, kteří nechtějí vidět jejich archivovaný webový obsah. Uznáváme, že společnost M me Shell má platná autorská práva a je použitelná na jejích stránkách, a litujeme, že registrace jejich stránek ve stroji Wayback Machine vyústila v tento soudní spor. Jsme rádi, že máme tento případ za sebou. „ Shell řekl: „ Respektuji cíl a historickou hodnotu internetového archivu. Nikdy jsem neměl v úmyslu zasahovat do tohoto cíle nebo způsobit škodu. "
Situace v oblasti autorských práv v EvropěV Evropě může Wayback Machine někdy porušovat zákony o autorských právech. Pouze tvůrce může rozhodnout, kde bude jeho obsah publikován nebo reprodukován. Stránky by měly být z archivu na žádost tvůrce odstraněny.
V Evropě je evropský internetový archiv konkurentem.