25/03/2016

Comment fonctionne le moteur de recherche google

La pondération des mot-clés, le Keyword Trust ?

A part le CF/TF qui sont des indicateurs d'influence externe qui sont des indicateurs statistiques inventé par majestic et que l'on retrouve chez tous les tools seo via distribution d'appli, est-ce qu'il y a quelque part chez Google une pondération des mots-clé eux-même ?
Un mot-clé qui serait plus fort que son synonyme, et est-ce que l'étude d'un keywords en anglais et son synonyme en anglais a juste été traduit en français pour avoir une pondération plus forte ?

Comment google classe ses pages
Et si le moteur de recherche et Ranky brain étaient 2 traitement à part ? (image searchengineland)




Cette pondération ferait que des sites neufs qui n'ont ni CF, ni TF se placent sur certains mots-clés de 3 mots.

Et s'il n'y avait qu'un remplissage des vides ? Certaines requêtes seraient induites par le ranky brain.

En gros Il y aurait une prise en compte d'un TF/CF + mot-clé forte pondération qui se placerait mieux que TF/CF qui n'a pas le bon mot-clé dans la théma.

Voici le détail de toutes les étapes de traitement d'une requêtes, des critères de classement et d'analyse des pages par google de façon automatique, rank brain et de façon manuel (traitement webspam)



Le fonctionnement de google vu par un ingénieur google

Au SMX West une présentation inattendue et très complète de google d'un point de vue du ranking, comment fonctionne google "How google works" par paul Haar.

Cette présentation de 69 slides qui montre étape par étape comment google traite les données, dans quel ordre et comment il les traites.

La présentation commence avec la recherche sur Google aujourd'hui virgule la recherche et Mobile first, il y a des nouvelles fonctionnalités:

La recherche Google aujourd'hui


Suggestion de correction orthographique 
  • Autocompletion
  •  recherche similaire
  • Questions similaires 
  • Calculatrice
  • Knowledge graph 
  • Réponse 
  • Featurette Snippet
  •  Maps
  •  images
  • vidéos
  • In-depth article
  • Horaire des films
  • Résultat de sport
  • Position des vols d'avion

Positionnement dans le moteur de recherche


10 liens bleus

Quels documents montrons nous ?

Dans quel ordre les montrons nous ?


La vie d'une requête


2 parties du moteur de recherche :
  • avant la requête
  • execution de la requête

Avant la requête

Crawl du web
Analyse des pages crawlées
- extraction des liens
- rendu du contenu
- annotation sémantique

Construire un index

Fonctionnement de l'index Google

Comme l'index d'un livre

Pour chaque mot, une liste de pages sur lesquels ils apparaissent

Émietter en groupe de millions de pages
- chez google , cela s'appelle des shards (tesson)
- 1000 tessons pour l'index web
- plus metadata par document


Exécution de la requête


Compréhension de la requête et expansion
Récupération et notation
Récupération post ajustement

Compréhension de la requête


Est-ce que la requête correspond a une entité connue ?


Convention sans José
Matt cutts

Est-ce qu'ils sont des synonymes utiles ?

[Gm trucks]: "gm" ->"général motors"
[Gm corn]:-> "génétiquement modifié"

Le contexte importe


Récupération et notation des résultats


Envoyer la requête a tous les shards
Pour chaque shard :
  • Trouver les pages correspondantes
  • Calculer un score pour la requête + la page
  • Renvoyer le top N pages par score

Combiner toutes les top pages

Trier par score

  • Ajustement post-traitement 
  • Regroupement d'hôtes, sitelinks
     

Y a t'il trop de duplication ?


Rétrogradation du spam, action manuelle


Que font les ingénieurs classement ? Version 1


Ils écrivent du code pour ces serveurs

Les Signaux de notation

Signal 

Un morceau d'information utiliser pour la notation
Requête indépendante - fonctionnalités de la page

  • - page rank, langage, mobile friendly
    Dépendant de la requête 
  • - fonctionnalités de la page et requête
    Mots-clés tapés, synonymes, proximité


Qu'est-ce qu'un ingénieur de classement fait ?

Regarde pour de nouveaux signaux

Combine les anciens signaux d'une nouvelle manière


Metrics (mesures)

Si vous ne pouvez pas mesurer, vous ne pouvez pas l'améliorer.

Metrics clés

Pertinence
Est-ce qu'une page est utile pour la requête de l'utilisateur ?
Classement top métrique en ligne

Qualité
Est-ce que les résultats que nous affichons sont bons ?

Temps de réponse (plus c'est rapide, mieux c'est)



Les meilleures réponses importent

Poids des positions
Classement métriques réciproques
Position 1 vaut 1
Position 2 vaut 1/2
Position 3 vaut 1/3
Position 4 vaut 1/4

Que font les ingénieurs de classement (version3)

Optimiser nos Mesures

Mais d'où viennent les mesures ?


Évaluation des résultats de recherche

Comment mesurons nous nous même ?
  • Expérimentations en live
  • Notation par des expérimentations humaines


Expérimentation en live des résultats

  • AB testing sur du trafic réel
  • Regarder les changements sur les modèles
  • Plus difficile a comprendre que ce que l'on croit
  • Beaucoup de trafic est une expérience ou une autre.


Interpréter les expérimentation live

Les 2 pages P1 et P2 répondent au besoin utilisateur
Pour P1, la réponse est sur la page
Pour P2, la réponse est sur la page et sur le Snippet.
L'algorithme A met P1 avant P2, l'utilisateur clique sur P1 => "Bon"
L'algorithme B met P2 avant P1 = aucun clic => "mauvais"

Est-ce que l'on pense vraiement que A est meilleur que B ?


Expérimentation de notation humaine.

L'Expérience de la notation humaine

Montre des expérience de résultats de recherche de vraies personnes.

Demandez-vous a quel degrés les résultats sont bons.

Les notes sont aggrégées entre les noteurs

Publication de lignes de conduite expliquant les critères pour les noteurs.

Les outils de support pour faire cela de façon automatique

Résultat de tâches de notation


Deux échelles

Besoins nécessaires 

Est-ce que cette page répond au besoin de l'utilisateur ?
Notre métrique de pertinence actuelle

Qualité de la page

Comment cette page est-elle bonne ?


Mobile first

Notation mobile First


Les besoins satisfont aux questions posées (noteurs) pour se focaliser sur le mobile dont l'utilisateur a besoin et penser comment il peut être utile et satisfaire au résultats pour un utilisateur mobile.


Comment le rendre les résultats orienté mobile ?


Plus de réponses Mobile que sur ordinateur dans les échantillons

Faire attention à la position (géolocalisation) de l'utilisateur

Outils pour afficher sur mobile l'expérience utilisateur

Les noteurs visitent les sites web sur smartphones.


Les besoins satisfont la notation
  • Satisfont complètement
  • Satisfont grandement
  • Satisfont modérément
  • Satisfont un peu
  • Ne satisfont pas


Notation de la qualité des pages 

Concept de qualité de page

  • Expertise
  • Autorité
  • Fiabilité

Haute qualité expertise

Une quantité satisfaisante de contenu principal de haute qualité

La page et le site ont une expertise, une autorité et digne de confiance pour le sujet de la page.

Le site web a une bonne réputation pour le sujet de la page.


Basse qualité de page


  • La qualité du contenu principal est très bas
  • Il y a un nombre de contenu principal qui ne satisfont pas .
  • L'auteur n'a pas d'expertise ou n'est pas digne de confiance pour l'autorité de ce sujet
  • Le site a une réputation négative
  • Le contenu secondaire est distrayant et inutile
Ceci est une traduction d'un ingénieur de google.