Vous cliquez sur une référence sur Wikipedia, seulement pour trouver l’URL est cassée. C’est frustrant, mais cela devrait arriver moins souvent maintenant grâce à The Internet Archive.
Les sites Web meurent, et même s’ils ne le font pas, ils suppriment parfois des articles et des pages. C’est un problème pour Wikipédia, qui renforce sa crédibilité en partie en citant d’autres sites Web. Un effort de trois ans de The Internet Archive signifie que 9 millions de citations Wikipédia précédemment brisées indiquent la Wayback Machine de l’Archive, donnant accès à des sources qui seraient autrement difficiles à retrouver pour les utilisateurs.
Voici Mark Graham, écrivant dans un article de blog officiel des archives Internet à propos du programme:
Depuis plus de 5 ans, Internet Archive archive presque toutes les URL référencées dans près de 300 sites wikipedia dès que ces liens sont ajoutés ou modifiés au rythme d’environ 20 millions d’URL / semaine.
Et depuis 3 ans, nous exécutons un robot logiciel appelé IABot sur 22 éditions de langue Wikipédia à la recherche de liens brisés (URL qui renvoient un «404» ou «Page non trouvée»). Lorsque des liens rompus sont découverts, IABot recherche des archives dans Wayback Machine et d’autres archives Web pour les remplacer. La restauration des liens garantit que Wikipédia reste précis et vérifiable et répond ainsi à l’une des trois politiques de contenu de base de Wikipédia: «Vérifiabilité».
Le bot a corrigé 6 millions de liens en pointant vers les archives, tandis que les éditeurs de Wikipédia en ont lié 3 millions d’autres. C’est un véritable service pour les internautes, qui peuvent désormais vérifier des références qui autrement seraient perdues. C’est un peu effrayant qu’un organisme à but non lucratif doive faire ce travail, mais je suis content que quelqu’un le fasse.