Les arcanes du plus célèbre moteur de recherche renferment une incroyable machine au service de l’internaute et de l’information.

La page d’accueil volontairement dépouillée de Google cache des mécanismes particulièrement complexes avec des volumes de données qui donnent le tournis.

comment google répond aux requêtes

anatomie d’une recherche google

Alors concrètement que se passe-t-il lorsque vous posez une question à Google ?

  1. Tout d’abord, en tâche de fond, les robots de Google parcourent le web de liens en liens en permanence et indexent les nouvelles pages, les classent et leur applique un premier traitement. C’est l’indexation. Et l’index de Google contient plus de 100 millions de Go de données représentant plus d’un million d’heures de travail informatique cumulé.
  2. Lorsqu’en tant qu’internaute vous arrivez sur la page d’accueil du moteur de recherche de Moutain View, Google fournit la page de recherche.
  3. Envoyer une requête à Google revient à faire voyager 2500km à sa question. La requête rebondit de serveurs en serveurs et peut être adressée à plusieurs datacenters du moteur de recherche. L’information se déplace à travers internet à plusieurs centaines de millions de km / heure.
  4. Dès les premiers caractères frappés au clavier, l’autocomplétion s’active et des suggestions de recherche sont renvoyés par le moteur et apparaissent sur l’écran. Cela permet d’orienter les recherches, d’accélérer la fourniture d’une réponse et de faciliter le travail du moteur (travail en arrière plan).
  5. Une fois la requête finale saisie, le moteur doit trier les différents résultats possibles selon plus de 200 facteurs avec pour chacun une dizaine de variations. Ces facteurs et leur pondération sont secrets (c’est l’algorithme tant recherché des référenceurs) et mouvants (plus de 500 modifications mineures ou majeures chaque année).
  6. Les résultats sont affichés par pertinence sur votre navigateur.

Toutes ces étapes se font généralement en moins de 250ms.

Quelques éléments supplémentaires

  • Depuis 2003, Google a répondu à plus de 450 milliards de requêtes différentes. Et plus de 15% des requêtes journalières sont des nouvelles requêtes.
  • La vitesse à laquelle l’internaute reçoit la réponse est fondamentale (l’impression de vitesse plus que la vitesse réelle – ce que permet l’autocomplétion par exemple). Et plus le site web est rapide à fournir des réponses, plus les internautes achètent. Plusieurs études corroborent ce dernier point
  • L’incroyable vitesse à laquelle répond le moteur de recherche lui impose un pré-travail. Google répond en direct mais le travail est préparé en amont. Cela influe sur le référencement des sites web. L’indexation et le positionnement sont deux choses différentes.
  • Avoir à traiter des masses colossales d’informations est un vrai problème. Augmenter les ressources ne permet pas d’augmenter linéairement les performances. Conclusion : les moteurs doivent trier l’information toujours plus importante pour conserver un même niveau de qualité de service.

Image et chiffres clés : Google Inside Search