Accueil > Articles> > Le Web invisible

Article publié le samedi 2 mars 2002 mis à jour le samedi 21 janvier 2012

Recherche d’information

Le Web invisible

On parle parfois du web invisible, mais que cela signifie-t-il ?

« Effectuer une recherche sur le Net en utilisant uniquement les moteurs et annuaires généralistes revient à ignorer des milliers de sources validées, offrant des informations à valeur ajoutée. Parallèlement aux grands moteurs et annuaires, il existe en effet de nombreux outils qui franchissent les limites du Web visible et identifient ou interrogent les sites du Web invisible : guides et annuaires sélectifs, sites fédérateurs, annuaires thématiques et vortails , agents pour la recherche et la veille, interfaces des grands serveurs. »

Béatrice FOENIX-RIOU, in « Recherche sur le Web visible et invisible », 2001

Définition succinte

Le Web invisible, aussi nommée Web caché ou Web profond (deep Web), est en fait l’ensemble des sites qui sont

  1. non indexées ou peu indexées par les moteurs de recherche ;
  2. trop volumineux pour être indexés en totalité ;
  3. les cataklogues bibliothèques en ligne ;
  4. les bases de données spécialisées ;
  5. les bases de données payantes ;
  6. les sites à accès privé ;
  7. les intranets et extranets.

Versatilité du Web

Si le Web est éphémère, des tentatives pour conserver toute la production électronique, à l’instar de nos bibliothèques qui conservent les incunables, se mettent déjà en place pour le futur...

Internet Archive
L’idée qu’un document sur le Web n’aurait en moyenne qu’une quarantaine de jour de vie a inquiété le bibliothécaire américain Brewster KAHLE qui a décidé d’archiver le Web perdu dans une gigantesque base de données de 100 teraoctets, « Internet Archive »
http://www.archive.org/

La BNF et le Dépôt Légal
De son côté, la Bibliothèque Nationale de France n’est pas en reste. En janvier 2006, elle publiait dans son journal interne « Trajectoire » un article sur le lancement du dépôt légal pour les sites Web du domaine français. Quelques teraoctets ou petaoctects de sauvegarde en vue...

Bases de données en ligne

Une base de données peut être définie comme une collection de données enregistrées ensemble, sans redondances pénibles ou inutiles, pour servir plusieurs applications. Les données y sont enregistrées de telle manière qu’elles soient indépendantes des programmes qui les utilisent.

« On peut considérer à l’heure actuelle qu’il y a deux grands modes de diffusion de l’information électronique : - les serveurs commerciaux apparus à partir des années 60 qui fournissent une information sous forme bibliographique, bien identifiée, validée, analyses et payante ; - internet qui diffuse une information hétérogène, peu validée, mal localisée mais en texte intégral et très souvent gratuite. Les deux approches sont en train de converger après une période de développement parallèle, mais la situation est loin d’être stable ».

Jean-Pierre LARDY, in Techniques d’accès à l’information médicale, 1998


Écrire à l'auteur

Moteur de recherche

  

Mot-clef de l'article


Autres Articles

 

Ce site est mis à disposition sous un contrat Creative Commons : http://creativecommons.org

Plan du site | Se connecter