Přerušený odkaz

Mrtvý link , nefunkční odkaz , link rozbité nebo odkaz zlomený je hypertextový odkaz , který přesměrovává na webové stránky nebo webové stránky, již neexistuje. Ve webovém měřítku tento jev odpovídá úpadku odkazů , v angličtině známému jako link rot .

Příčiny

Odkaz může být přerušen z několika důvodů. Nejjednodušší a nejběžnější vysvětlení je, že webová stránka již neexistuje, což většinou vede k chybě HTTP 404 , což znamená, že server reagoval dobře, ale konkrétní stránku nelze najít. Možné jsou i jiné návratové kódy , stránka mohla být přesunuta nebo přejmenována na serveru nebo může být přesunut nebo přejmenován samotný server.

Mezi další důvody přerušení odkazu patří:

Prevalence

Několik studií zkoumalo výskyt přerušených odkazů na webu, mezi akademickou literaturou a digitálními knihovnami . V roce 2003 byl proveden experiment Fetterly et al. zjistil, že každý týden přestal platit přibližně jeden z 200 odkazů. Nelson a Allen (2002) zkoumali rozpad odkazů v digitálních knihovnách a zjistili, že 3% objektů již nejsou po jednom roce přístupné.

V roce 2004 další studie ukázala, že podmnožiny internetových odkazů (které se zaměřují na konkrétní typy souborů nebo jsou hostovány akademickými institucemi) by mohly mít radikálně odlišný efektivní život. Zdá se, že adresy URL publikací mají na internetu delší životnost než jiné adresy URL. Studie společnosti Weblock z roku 2015 analyzovala více než 180 000 odkazů na zdroje v korpusu tří hlavních vydavatelů s otevřeným přístupem a zjistila průměrnou délku života 14 let, což potvrzuje studii z roku 2005, která zjistila, že polovina adres URL nalezených v článcích časopisu D-Lib je stále aktivní 10 let po zveřejnění. Jiné studie zjistily vyšší míru zkažených odkazů v akademické literatuře, ale ukazují průměrnou délku života nejméně čtyři roky. Studie BMC Bioinformatics analyzovala téměř 15 000 odkazů v abstraktech indexovaných citací z Thomson Reuteur Web of Science a dospěla k závěru, že medián životnost webové stránky byla 9,3 roku a pouze 62% stránek bylo archivováno.

Studie provedená v letech 2016--2017 na serveru Yahoo! Directory (adresář Yahoo!, který se po 21 letech vývoje přestal aktualizovat v roce 2014) dospěl k závěru, že efektivní životnost odkazů byla dva roky.

Prevence a detekce

Strategie prevence špatných odkazů se mohou zaměřit na to, kam umístit obsah tak, aby byla nejvyšší pravděpodobnost, že tam zůstane, a také na používání autoritativních odkazů, u nichž je menší pravděpodobnost poškození, nebo na opravy odkazů, jejichž cíl byl odstraněn nebo přemístěn.

Vytváření adres URL, které se časem nezmění, je základním způsobem, jak zabránit špatným odkazům. Tim Berners-Lee a další internetoví průkopníci jsou zastánci preventivního plánování.

Strategie propojení autorit zahrnují:

Mezi strategie ochrany stávajících odkazů patří:

Detekci nefunkčních odkazů lze provádět ručně nebo automaticky. Mezi automatické metody patří plug-iny pro systémy správy a také samostatné kontroly nefunkčních odkazů, například Xenu's Link Sleuth. Automatická kontrola nemusí detekovat odkazy, které odkazují na 404, nebo odkazy, které vracejí odpověď 202 OK, ale odkazují na obsah, který se změnil.

Reference

  1. (in) P. Habibzadeh, „  Rozpad odkazů na webové stránky v článcích publikovaných v General Medical Journals: Mainstream vs Small Journals  “ , Applied Clinical Informatics , sv.  4, n O  4,2013( DOI  10.4338 / aci-2013-07-ra-0055 , číst online , přistupováno 7. září 2015 )
  2. "  Smrt TLD  " [ archiv26. července 2018] , na blog.benjojo.co.uk (přístup 27. července 2018 )
  3. P. Habibzadeh , „  Rozpad odkazů na webové stránky v článcích publikovaných v General Medical Journals: Mainstream vs Small Journals  “, Applied Clinical Informatics , sv.  4, n O  4,2013, str.  455–464 ( PMID  24454575 , PMCID  3885908 , DOI  10.4338 / aci-2013-07-ra-0055 )
  4. "  Hiberlink  " [ archiv serveru29. ledna 2015] , Hiberlink.org (přístup k 15. lednu 2015 )
  5. (in) Dennis Fetterly, Mark Manasse, Mark a Janet Najork Wiener, „  Rozsáhlá studie vývoje webových stránek  “ , WWW '03 Sborník z 12. mezinárodní konference o World Wide Web ,2003, str.  669-678 ( ISBN  1-58113-680-3 , DOI  10.1145 / 775152.775246 , číst online )
  6. (in) Michael L. Nelson a Danette B. Allen , „  Persistence a dostupnost objektů v digitálních knihovnách  “ , D-Lib Magazine , sv.  8, n o  1,ledna 2002( DOI  10.1045 / leden 2002-nelson )
  7. Wallace Koehler , „  Pokračovalo podélné studium webových stránek: zvážení perzistence dokumentu  “, Information Research , sv.  9, n O  22004( číst online [ archiv11. září 2017] , zpřístupněno 31. ledna 2019 )
  8. „  Zpráva o nepřetržitém Weblocku  “ [ archiv4. března 2016] ,srpna 2015(zpřístupněno 12. ledna 2016 )
  9. Frank McCown, Sheffan Chan, Michael L. Nelson a Johan Bollen (2005) „  Dostupnost a perzistence webových odkazů v časopise D-Lib  “ Sborník z 5. mezinárodního semináře pro archivaci webových stránek a digitální uchování (IWAW'05) . Zpřístupněno 12. 10. 2005. 
  10. Diomidis Spinellis , „  Úpadek a selhání webových odkazů  “, Komunikace ACM , sv.  46, n o  1,2003, str.  71–77 ( DOI  10.1145 / 602421.602422 , číst online )
  11. Steve Lawrence , David M. Pennock , Gary William Flake , Robert Krovetz , Frans M. Coetzee , Eric Glover , Finn Arup Nielsen , Andries Kruger a C. Lee Giles , „  Persistence webových odkazů ve vědeckém výzkumu  “, Computer , sv.  34, n O  22001, str.  26–31 ( DOI  10.1109 / 2.901164 )
  12. Jason Hennessey a Steven Xijin Ge , „  Cross Disciplinary Study of Link Decay and the Effectiveness of Mitigation Techniques  “, BMC Bioinformatics , sv.  14,2013, S5 ( PMID  24266891 , PMCID  3851533 , DOI  10.1186 / 1471-2105-14-S14-S5 )
  13. Hans van der Graaf , „  Poločas rozpadu odkazu je dva roky  “ [ archive du17. října 2017] , na blogu ZOMDir (přístup k 31. lednu 2019 )
  14. Tim Berners-Lee , „  Skvělé identifikátory URI se nemění  “ [ archiv2. března 2000] ,1998(zpřístupněno 31. ledna 2019 )
  15. Leighton Waltera Kille , „  rostoucí problém Internetu“ Link Rot „a osvědčených postupů pro média a online vydavatelů  " [ Archiv12. ledna 2015] , Zdroj novináře, Harvard Kennedy School,8. listopadu 2014(zpřístupněno 16. ledna 2015 )
  16. systémy mohou zaznamenat přerušení svých služeb, což způsobí, že adresy URL budou dočasně nedostupné.
  17. Parham Habibzadeh , „  Jsou současné archivační systémy dostatečně spolehlivé?  ”, International Urogynecology Journal , sv.  26, n o  10,30. července 2015, str.  1553 ( ISSN  0937-3462 , PMID  26224384 , DOI  10.1007 / s00192-015-2805-7 )
  18. „  Internetový archiv: Digitální knihovna bezplatných knih, filmů, hudby a Wayback Machine  “ [ archiv26. ledna 1997] ,10. března 2001(zpřístupněno 7. října 2013 )
  19. Gunther Eysenbach a Mathieu Trudel , „  Jdeme, jdeme, stále tam: Používání služby WebCite k trvalé archivaci citovaných webových stránek  “, Journal of Medical Internet Research , sv.  7, n o  5,2005, e60 ( PMID  16403724 , PMCID  1550686 , DOI  10.2196 / jmir.7.5.e60 )
  20. Jonathan Zittrain , Kendra Albert a Lawrence Lessig , „  Perma: Scoping and Addressing the Problem of Link and Reference Rot in Legal Citations  “, Legal Information Management , sv.  14, n O  212. června 2014, str.  88–99 ( DOI  10.1017 / S1472669614000255 , číst online )
  21. „  Centrum Berkman University na Harvardově univerzitě vydává nástroj Amber, nástroj„ vzájemné pomoci “pro blogery a vlastníky webových stránek, který pomáhá udržovat web k dispozici | Berkman Center  “ [ archiv2. února 2016] , na cyber.law.harvard.edu (přístup 28. ledna 2016 )
  22. John Mueller , „Informace  o nejnovějších funkcích lišty Google Toolbar  “ [ archiv13. září 2008] , Blog Centra pro webmastery Google,14. prosince 2007(zpřístupněno 9. července 2008 )
  23. Ziv Bar-Yossef, Andrei Z. Broder, Ravi Kumar a Andrew Tomkins (2004) „Sic transit gloria telae: k porozumění úpadku webu“ Sborník 13. mezinárodní konference o World Wide Web - WWW '04 : 328– 337 s. ( DOI : 10,1145 / 988672,988716 ). 

Podívejte se také

Související články

Bibliografie