Qu'est
ce qu'un moteur de recherche ? qu'est ce qu'un robot ?
Tout d'abord, vous devez comprendre ce qu'un moteur de
recherche cherche réellement. Quand un visiteur
potentiel fait une recherche dans un moteur de recherche,
tel que Google ou Yahoo!, il ne recherche pas
sur le Web, mais il vérifie une base de données
(un index) compilée par ce moteur de recherche.
Cette base de données comprend le texte et les
liens des pages Web qui ont été visitées
par le robot du moteur de recherche.
Comment une
base de données d'un moteur de recherche est compilée
?
Les moteurs de recherche compilent ces bases de données
automatiquement en utilisant des programmes logiciels
"robots", appellés aussi "araignées"
(spiders). Ces programmes automatiques visitent des pages
sur le World Wide Web, en commençant à un
certain emplacement souvent arbitraire et en suivant les
liens qu'il y trouve ou qui lui sont soumis. Quand un
propriétaire de site Web "soumet" une
page à un moteur de recherche, dans la plupart
des cas elle fournit au robot du moteur de recherche un
point de départ pour leur voyage automatique. Démarrant
à partir de cet emplacement, le robot suit alors
des liens et "découvre" ainsi d'autres
pages dans votre site Web ou visite d'autres sites auxquels
votre site est joint. (c'est comme ça, d'ailleurs,
que les moteurs de recherche peuvent trouver les différentes
pages ou les sites entiers qui ne leur ont jamais été
soumis (s'il y a un lien d'un site à un autre,
les chances sont bonnes que par la suite un robot de moteur
de recherche aille trouver ce lien et le suive.)
Qu'est
ce qu'un robot peut lire ?
Les robots lisent le texte dans le code HTML des pages
qu'il trouve sur le web. Malgré des efforts récents
par Google de lire le contenu textuel de fichiers Flash,
pour lequel il est encore trop tôt de dire s'il
apporte des résultats probants, les moteurs de
recherche n'arrivent le plus souvent pas à lire
ce type de fichier.
Quoique les robots visitent les pages comme les visiteurs
humains, ce qu'elles peuvent faire avec ce qu'elles "voient"
est tout à fait différent. Quand un visiteur
humain emploie un navigateur pour visualiser un page Web,
ce visiteur peut lire le texte sur la page, regarder les
images, films, jeux, écouter des bruits, soumettre
de l'information dans des formulaires, suivre des hyperliens,
et nombre d'autres tâches. Le visiteur humain agit
vraiment avec le site. Le robot d'un moteur de recherche,
lui, peut seulement faire quelques unes de ces choses.
C'est cette différence qui explique l'exclusion
de certaines pages (dynamiques, avec du Flash,...) de
la base de données d'un moteur de recherche.
Qu'est-ce qu'un
robot fait ?
Les robots de moteurs de recherche arrivent à "lire"
du texte, et ils peuvent suivre des liens simples du type:
< a href="mapage.html">Ma Page</a
>
ou la légère variation :
< a href="mapage.html><img src="monimage.gif"></a
>
Les robots ne peuvent pas visualiser un film
instantané, ils ne peuvent pas compléter
un formulaire, et ils ne peuvent pas cliquer sur des boutons.
Quelque soit la qualité du contenu
de votre site, si un visiteur doit y accéder à
partir d'un menu déroulant, un mot de passe ou
un formulaire avant d'y accéder, aucun robot ne pourra visiter ces pages.