Les moteurs de recherche favorisent les sites web déjà bien établis. Ça peut paraître injuste pour les nouveaux entrants mais c’est ainsi. Google veut pousser d’abord les sites de confiance et un site ancien à plus de probabilité d’être recommandable que le petit nouveau. Néanmoins, un site bien construit se référence « tout seul » et il faut vraiment mettre de la mauvaise volonté pour ne pas réussir à faire connaître ses pages aujourd’hui.

SEO : comment favoriser l'indexation

Bien faire indexer son site web

Alors combien de temps pour référencer un site ? Rien n’est simple en référencement et la meilleure réponse que l’on peut faire est « Ça dépend ». D’ailleurs on ne référence pas un site mais des pages web. Et puis il a a plusieurs aspects derrière cette question : la découverte du nom de domaine, la découverte des pages, leur indexation et leur conservation.

Faire découvrir un site web

La première tâche est de faire découvrir le site web aux moteurs de recherche. Il y a des aspects pratiques à vérifier : le site est-il indexable ? le site est-il suffisamment abouti pour qu’il soit parcouru et montré aux internautes ? Normalement, ce premier jeu d’action est facile et quasiment automatique si le site a été construit par un pro. On peut aider la découverte du site via différents moyens et notamment en le déclarant sur les interfaces webmasters des moteurs (Google Search Console, Bing Webmaster Tools).

Les moteurs passent vite. On peut le voir en regardant les logs (depuis l’hébergement) mais c’est fastidieux et pas très lisible. Certains outils d’analyse de logs peuvent venir à la rescousse mais on s’en sert surtout plus tard pour suivre la découverte des autres pages.

Si le site a été longtemps à l’abandon ou interdit d’indexation, il faut parfois tendre la perche aux moteurs pour qu’ils reviennent et l’explorent de nouveau. On peut le faire via les outils webmasters et via des liens qui pointent vers le site. Ce second point est d’ailleurs fondamental. Si un site a de multiples points d’entrées avec des liens depuis le web vers des pages diverses (pas seulement l’accueil), c’est autant de points de départ pour les crawlers des moteurs de recherche. C’est la meilleure façon de faire découvrir des pages d’un site.

Faire connaître les pages du site web

Une fois que le site est connu, il faut que les moteurs le parcourent et trouvent tous ces contenus. Si le site fait moins de 100 pages et que le site a une architecture propre, il n’y a rien à faire. Les robots sautent de pages en pages et reviennent plus tard pour prendre le temps de « lire » les pages et pourquoi pas de les indexer.

Pour les sites profonds (des pages loin de l’accueil avec beaucoup de bonds à faire pour arriver au contenu), pour les sites mal conçus avec des problèmes d’architectures (contenus similaires avec urls différentes, pages inaccessibles, pages masquées, pages trop lentes à charger…), le parcours des robots peut être laborieux et ces derniers peuvent décider de revenir (peut-être) plus tard.

Ici aussi les liens et les consoles webmasters sont utiles :

  • Les liens entrants renforcent le référencement de la page. Les moteurs vont d’abord s’attarder sur les pages les plus liées (via des liens internes mais aussi par des liens en provenance du reste du web)
  • Les outils webmasters permettent de transmettre des plans de site aux moteurs. Ce sont les fichiers sitemap.xml. Ils permettent de faire gagner du temps aux moteurs : en leur fournissant un plan de tout le contenu, ils économisent le travail de découverte. De plus, côté webmaster, on obtient des informations intéressantes : quelles pages ont été parcourues, indexées (ou pas) et pourquoi.
  • Historiquement, on utilisait aussi les services de Ping pour faire découvrir les nouveaux contenus. Intérêt limité plus la notoriété d’un site va croissante. À noter que WordPress s’en sert lors de chaque publication (via Pingomatic)

Faire indexer les pages web

Avoir des pages connues sur son site c’est bien. Avoir des pages que les moteurs veulent bien présenter aux internautes c’est mieux. À part les aspects techniques (que le page soit indexable, qu’elle ne soit pas redirigée et qu’elle ne mette pas plus de 10 secondes à charger) et les aspects liés au contenu (suffisamment important pour mériter d’être indexé, pas un copié-collé), il n’y a pas grand chose à faire. Si une page est suffisamment intéressante et qu’elle n’a pas un vilain problème flagrant, il n’y a aucune raison qu’elle ne soit pas (au bout d’un moment) indexée.

Pour aider à l’indexation, avoir des liens qui pointent vers les pages profondes aide. Ce peut être des liens en provenance d’une page déjà bien indexée (la page d’accueil) ou des liens externes.

Sur Google, la commande site: suivi du nom du site ou de la page à vérifier permet de tester si une page web est présente dans l’index principal. Moyen simple de contrôle, cette commande permet aussi de lever facilement des erreurs typiques (un site de 200 pages qui aurait 1000 pages indexées typiquement).

Conserver les pages indexées

C’est assez rare que les moteurs décident de désindexer des pages. Cela peut arriver :

  • lorsque les pages deviennent inaccessibles (erreur serveur, lien cassé, redirection, page indiquée comme non indexable)
  • lorsque les pages deviennent vraiment moins intéressantes (contenu obsolète)
  • lorsque les pages sont sanctionnées (mais dans ces cas là, on sait pourquoi !)
  • lorsque l’architecture du site a beaucoup changé et que les moteurs sont perdus (afflux de nouvelles pages, arborescence confuse).

Combien de temps pour faire référencer un site web ?

Une fois que les pages sont découvertes et indexées, il faut encore qu’elles soient proposées à l’internaute lorsque ce dernier fait une recherche. C’est un autre problème.

Pour un site connu et apprécié par les robots, la découverte et l’indexation d’une nouvelle page peut se faire en quelques secondes ! Pour un site tout neuf, en l’aidant un petit peu, les premiers contenus peuvent être découverts et indexés en quelques jours. La vitesse à laquelle les autres pages seront parcourues puis indexées dépendra des facteurs cités plus haut (architecture, liens entrants).