Robot d'indexation

Si ce bandeau n'est plus pertinent, retirez-le. Cliquez ici pour en savoir plus.

Cet article ne cite pas suffisamment ses sources (septembre 2011).

Si vous disposez d'ouvrages ou d'articles de référence ou si vous connaissez des sites web de qualité traitant du thème abordé ici, merci de compléter l'article en donnant les références utiles à sa vérifiabilité et en les liant à la section « Notes et références ».

En pratique : Quelles sources sont attendues ? Comment ajouter mes sources ?

Un robot d'indexation (en anglais web crawler ou web spider, littéralement araignée du Web) est un logiciel qui explore automatiquement le Web. Il est généralement conçu pour collecter les ressources (pages Web, images, vidéos, documents Word, PDF ou PostScript, etc.), afin de permettre à un moteur de recherche de les indexer.

Fonctionnant sur le même principe, certains robots malveillants (spambots) sont utilisés pour archiver les ressources ou collecter des adresses électroniques auxquelles envoyer des courriels.

En français, depuis 2013, crawler est remplaçable par le mot collecteur^[1].

Il existe aussi des collecteurs analysant finement les contenus afin de ne ramener qu'une partie de leur information.

↑ Olivier Robillart, « Collecteur et enregistreur de frappe remplacent les termes "Crawler" et "Keylogger" », Clubic, 2 janvier 2013.

[1] Olivier Robillart, « Collecteur et enregistreur de frappe remplacent les termes "Crawler" et "Keylogger" », Clubic, 2 janvier 2013.

[1]