1 million de captures d’écran sur une gigantesque carte interactive

Imaginez vous promener sur le web comme dans une gigantesque galerie d’art numérique où chaque tableau serait une capture d’écran de la page d’accueil d’un site. C’est exactement ce que propose One Million Screenshots. Des milliers de sites web y sont disposés côte à côte, formant un mur presque infini que l’on explore en zoomant ou en glissant de gauche à droite, comme sur une carte interactive.

Derrière cette fresque se cache le Common Crawl Web Graph, une immense base de données construite à partir de milliards de pages web. Chaque site y est classé selon son importance dans le réseau de liens, un peu comme le faisait le PageRank de Google à ses débuts. Les créateurs de One Million Screenshots ont simplement pioché dans le top 1 048 576 domaines pour composer cette mosaïque un peu particulière.

Vous vous demandez pourquoi des sites au look Windows 95, figés depuis des années, apparaissent encore ? Moi, je me la suis posée, en fait, le classement ne se base ni sur la fraîcheur du contenu ni sur le design, mais sur la position dans le réseau de liens. Certains sites ont accumulé tellement de backlinks à l’époque des annuaires, forums et blogs qu’ils conservent encore aujourd’hui leur place… tant que leur domaine et leur hébergement tiennent le coup, car, il y a pas mal de capture qui pointe vers rien également.

L’emplacement d’un site sur la carte est défini par un algorithme qui répartit les captures pour remplir harmonieusement l’espace. Les sites les mieux classés se retrouvent souvent vers le centre, mais l’organisation reste avant tout esthétique. Et si vous allez dans le coin en bas à gauche, vous tomberez sur une zone pleine de captures floutées… parfois pour des raisons évidentes. De temps en temps, c’est lisible, oups. Je parie que votre curiosité vous y emmènera tôt ou tard. Mais attention, ça sent parfois le malware ou le site vérolé à plein nez… Alors mollo sur la navigation dans les coins X, et je vous déconseille fortement de vous aventurer dans ces recoins sombres du web. Préférez les sites connus et reconnus, ils restent bien plus sûrs.

Mais si vraiment, vous voulez jouer les aventuriers, équipez-vous d’un kit de survie numérique du genre bloqueur de pubs costaud, un antivirus à jour, un navigateur ou un PC dédié à ce genre d’expédition, et idéalement une machine virtuelle. Ça ne vous rendra pas invincible, mais ça limitera sérieusement les mauvaises surprises. LOL

Si votre site est dans ce top million, il se cache quelque part sur cette carte. vincerolf.net n’y est pas… et ne le sera probablement jamais ! Je voulais vous partager cette trouvaille un peu originale.