Cours de référencement / SOE Présentation du module de formation

1. Pourquoi le SEO ? • Quelques mots-clés 2. Balayage des thèmes et chapitres du Cours distribué sous licence Creative Commons, selon les conditions suivantes : cours

Source des images indiquées au-dessous ou en cliquant sur l’image

Image : Source 1 2

Intérêt pour le e-commerce L’avenir de l’immobilier

• Internet : LE nouveau monde – Plus de 21 milliards de pages. • … Sans compter intranets, extranets, undernet, deep net.. • L’internet est le réseau de communication dont la pénétration aura connu la progression la plus forte et la plus rapide dans l’histoire. Il a été vingt fois plus vite que le téléphone, dix fois plus que la radio et trois fois plus vite que la télévision 1. L’avenir de l’immobilier … …. est sur internet, • Immobilier virtuel : – au lieu d’avoir « une boutique bien placée en ville », il faut désormais apparaître en bonne position des réponses obtenues par les internautes sur un moteur de recherche. – mais le positionnement sur cet immobilier virtuel est : 1. concurrentiel. 2. contrôlé par un nombre réduit d’acteurs ( … et les autres). 3. éphémère, – Pour • Une entreprise : un enjeu vital. • Un professionnel : des compétences très demandées

1) Comment le web change le monde, l’Alchimie des multitudes 3 4

Pourquoi le SEO ? Quelques mots-clés

• Publicité – marketing • Social media optimization • Paid inclusion • Pay per click ère • AdWords • Affiliate marketing • Conversion funnel / entonnoir de conversion • – Référencement naturel (≠liens sponsorisés) : positionner son site en 1 Conversion optimization page des moteurs de recherche • Algorithme de ranking • pour des mots-clés stratégiques ou pour la « longue traine » – PageRank • TrustRank • SERP Rank • Web harvesting • winners takes all : trois premiers résultats, première page .. • Optimisation pour les moteurs de recherche – SEO = Search Engine Optimization : de quoi s’agit-il ? – White / Black hat SEO : , , Page hijacking, a) Audit // Conception // Mise en ligne et déclaration // Optimisation et optimization, , , Spam de moteur de recherche Positionnement // Suivi • • Scraper site • Link farm • b) Pas « one shot » mais un processus continu, totalement lié au Web • Linking Analytics (=analyse du trafic sur un site) – Off-page optimization • Link exchange • • Rel= • Noindex • Meta elements • Meta Tags • Sitemap • Landing page optimization c) Comprendre le fonctionnement des moteurs de recherche : crawl, indexation, algorithme de ranking et recherche • Détermination et placement sur mots-clés – Keyword density / optimization / research / tracking • Long tail • Autres – Geo targeting • Stop words (mots vides) • Poison words • Online identity management • Online reputation management • Win-loss analytics • Web analytics

5 6

1 Les thèmes et chapitres du cours Questions ?

1. Origine du SEO, Google … et ses concurrents 2. La fréquentation d’un site : les fondamentaux 3. Dans la peau d’un moteur de recherche : le PageRank 4. Web Analytics et liens commerciaux 5. Optimisation du référencement – “Onpage” – “Onsite” – “Offsite” 6. Trouver et optimiser les mots-clés

7. Méthodologie de référencement et avenir du Rémi BACHELET SEO Enseignant-chercheur, Ecole Centrale de Lille

7 8

1- Origine du SEO, historique de Google Origine du SEO

1. Les premiers moteurs de recherche • Les algorithmes d’indexation Cours distribué sous licence Creative Commons, 2. Google … et ses concurrents selon les conditions suivantes :

Source des images indiquées au-dessous ou en cliquant sur l’image

Image : Source 9 10

Histoire du SEO Premiers algorithmes d’indexation

Aliweb requiert des fichiers "index", qui sont placés spécialement par les • Au début du web, pas de moteurs de recherche, mais des engins spécialisés ( the Wanderer mesure la taille du web), Gopher est un webmestres et qui y déclarent l'adresse de leur pages, les mots-clés protocole de classement) ou des indexeurs basiques ( Archie indexe les associés … fichiers disponibles en ftp ). – Mais ensuite les moteurs de recherche se basent sur des mots-clés insérés dans le code des pages • Premier moteur de recherche : Aliweb en 1993, il établi le principe de  Ce sont les étiquettes méta ou « meta tag » (meta parce qu’il fonctionnement qui est toujours d’actualité : s’agit de donner de l’information … sur de l’information). 1. On déclare ("to submit") l’adresse d’une page = son URL (Uniform Resource Locator commencant par http:// ) – Mais on est confrontés aux limites de l’utilisation des meta tags 2. Le moteur envoie un "crawler" (ou “spider”) télécharger la page. La page est comme indicateurs de la pertinence des pages : stockée sur le serveur du moteur de recherche… • Les webmestres y mettent des mots-clés sans rapport avec le contenu 3. … où elle est traitée par un indexeur pour en extraire les informations (mots- réel du site dans le but d'attirer du trafic = " spamdexing", "black hat" clés, liens) et les interpréter (importance, répétition…). • .. résultat : à cette époque, trouver la bonne page web est une 4. périodiquement, le "crawler" revient sur la page pour actualiser les informations. aventure…  Les premiers moteurs de recherche sont facilement manipulés et • Au milieu des années 1990, le problème de l'indexation des sites web pour discrédités mais d e nouveaux algorithmes d’indexation, plus difficiles à les rendre plus faciles à trouver émerge, car la visibilité d’un site devient un tromper sont développés… facteur de plus en plus important : le SEO (« Search Engine Optimization ») émerge en tant que champ de compétences  La course entre les moteurs de recherche et les – Selon Danny Sullivan , apparition du terme Search Engine Optimization vers 1997 webmasters qui veulent manipuler les résultats de recherche pour attirer du trafic s'engage… 11 12

2 Google : les débuts

• Des étudiants de Stanford, et développent "backrub," un moteur de recherche basé sur un algorithme d’indexation baptisé PageRank – Page Rank = nom de l'inventeur, Larry Page • L'algorithme calcule un indice basé sur les liens entrants : – PR (page X) = Σ PR (des pages qui donnent un lien vers X ) • Le principe n'est pas nouveau – Utilisé en recherche : citation index . On mesure l'importance d'un article au nombre de fois qu'il est cité dans d'autres articles. – Le moteur de recherche Inktomi utilise déjà ce principe – … et déjà des webmestres ont développé des manières de le manipuler pour tricher (link farms) • Google est fondé en 1998. – Le moteur de recherche est : • Dépouillé (page légère) • Simple (recherche "et" par défaut) • Rapide … et il devient très rapidement populaire (en quelques semaines)

13 14

Google, les chiffres : Le chiffre d'affaires de Google.

– Un index de plus de 24 milliards de pages (2007) – 23 000 employés dans le monde (2010) – Plus de 110 sites régionaux, de 130 interfaces linguistiques – La marque la plus populaire au monde [1] – Plus de 3 milliards de requêtes et 16 millions de visiteurs uniques par mois (2007) – Slogan « Don't be evil » 22 milliards de • Eric E. Schmidt, directeur dollars de • Sergey Brin, directeur technique liquidités au 30 • Larry E. Page, directeur produits septembre 2009 Les bénéfices nets

15 Source le Monde 16.10.09 16

Google sur le marché des Mais Google, c’est plus qu'un recherches moteur de recherche…

Google Earth, Analytics, Webmasters Tools, • En mai 2009, dans le monde , Youtube, … – 68,6 %, – Le modèle opposé à celui de Microsoft : on est – devant Yahoo! (9 %) prisonnier de MS contre son gré, essentiellement à – Baidu (8,7% - chinois). travers l’absence d’alternative et la non- interopérabilité • 85% à 90% de parts de trafic en Europe • En plus, on est obligé de payer …. • Sur le marché américain 65 % – avec Google, on devient dépendant … en choisissant – 19,6 % pour Yahoo! d’utiliser des applications innovantes .. • ..et gratuites… (ce « gratuit » ne l’est bien sûr pas réellement, il fait – 8,4 % pour Microsoft. partie du modèle économique). Source : ComScore

17 18

3 Politique d'acquisition de Analyse du succès de Google technologies

• Deja => • Le bon timing • Picasa => Picasa • Une philosophie : « Google attitude », • Keyhole, Inc => , Measure Map , => • Rupture technologique : Brin et Page ont des doctorats en en • Android => Android mathématiques.. et les ont valorisés • Phatbits => • Rapidité, simplicité • YouTube => YouTube (1.6MM$) • Pages de résultats dépouillées (sans publicité au début) • FeedBurner => • Une parfaite compréhension de la culture du Web • Upstartle , Zenter , Tonic Systems , 2Web Technologies => Google Documents – Gratuité • JotSpot => – Affinités avec l'Opensource • Marratech => – Innovation constante

Contrairement à MS, qui acheta souvent ses concurrents pour les éliminer, Google les valorise Source

19 20

Les concurrents de Google

• Yahoo! Search, ≈ Microsoft Live Search / Bing • Les outsiders : Exalead, Ask.com • Les annuaires et moteurs thématiques / régionaux – DMOZ – Une myriade de "micro" moteurs expérimentaux…

• De nouveaux venus ? – Mais le « ticket d'entrée » n'est-il pas aujourd'hui devenu énorme ?

Image : Source 21 22

Google comme étalon universel Google Universal Search

• Depuis mai 2007, une recherche sur Google propose sur sa search engine results page (SERP ) des résultats mixant : • Certes – des Pages web • Dans beaucoup de pays, le référencement – Des liens sponsorisés – Mais aussi naturel est devenu une « chasse au classement • Actualités, • Images, Google » • Livres • Cartes • Blogs • Vidéos • Définitions (define:)  Avec Universal Search, des contenus auparavant séparés sont présentés simultanément  Résultat : - encore plus de candidats à la première page + Des stratégies alternatives pour y figurer • Une évolution incessante : nouvelles versions régulièrement

23 24

4 Google, les vulnérabilités Google, les concurrents de demain • Modèle économique = le gratuit + les effets d’échelle – Un CA dépendant à 99% du marché des liens sponsorisés => fraude aux • Des alternatives à la manière d’accéder au web et à la recherche clics sur les pubs Adwords « façon Google » se développent à travers le « web social ». – Rentabilité difficile de Youtube et de nombreux autres services … – Facebook, Twitter : les informations « pertinentes » sont proposées par – Risque de dispersion, manque de cohérence (Android vs. Chrome OS les « amis », pas par un moteur de recherche. etc..) – Le temps passé sur le net est plus centré sur les interactions sociales • Microsoft et Yahoo! ont lancé, en juillet 2009 un partenariat destiné à proposées par ces services concurrencer Google dans la recherche sur Internet. – Microsoft, avec Bing, fournit la technologie • Cette approche consistant à « monétiser le réseau social » pose de – Yahoo! la vente d'espaces publicitaires plus en plus de questions sur le respect de la vie privée des utilisateurs – Google : Gmail + Google agenda + mémorisation des recherches de chaque Questions sur : compte pendant plusieurs mois voir p23 ) – L’abus de monopole (par exemple les pages des filiales de Google sont – Facebook : les informations du profil, photos etc … sont cédées à Facebook (cf. le souvent fort bien classée dans les SERP.. De Google) contrat d’utilisation) – La privatisation du patrimoine culturel (scannerisation de bibliothèques entières par , impact de sur la presse en ligne)

25 26

Les thèmes et chapitres du cours Questions ?

1. Origine du SEO, Google … et ses concurrents 2. La fréquentation d’un site : les fondamentaux 3. Dans la peau d’un moteur de recherche : le PageRank 4. Web Analytics et liens commerciaux 5. Optimisation du référencement – “Onpage” – “Onsite” – “Offsite” 6. Trouver et optimiser les mots-clés

7. Méthodologie de référencement et avenir du Rémi BACHELET SEO Enseignant-chercheur, Ecole Centrale de Lille

27 28

2- La fréquentation d’un site : les fondamentaux La fréquentation d’un site : les fondamentaux

1. Les trois piliers du trafic – Les accès directs – Les moteurs de recherche – Les sites référents Cours distribué sous licence Creative Commons, selon les 2. Les autres manières de capter du trafic conditions suivantes :

Source des images indiquées au-dessous ou en cliquant sur l’image

Image : Source29 30

5 Les trois piliers du trafic 1/ Les accès directs

• Ceux qui mettent en marque-page votre site et y reviennent directement Votre site fourni une réponse à leur besoin ! • Que faut-il analyser ? – Qui revient, selon quelle fréquence, quelles pages, quel CA… – But : comprendre qui sont ces « clients (modulo les erreurs méthodologiques : cookie fidèles » effacé, accès à partir une autre machine…)

31 32

2/ Les moteurs de 3/ Netlinking : Les recherche sites référents

• Ce référencement naturel … est le but de • Ces sites vous recommandent … – Ou vous détestent, mais le résultat est le même… cette formation – Lien fort avec le ranking de votre site Votre site est bien référencé !  Sauf si rel=nofollow • Que faut-il analyser ? – Il peut aussi s’agir des liens sponsorisés que vous achetez… (cf. chapitre 4 « Web Analytics et liens commerciaux »). – Quels mots clés, taux de rebond, quelle • Que faut-il analyser ? fidélisation ensuite, première visite ? – Ranking et autres liens de la page qui vous « linke » – taux de transformation = apport réel à l’objectif du – Raison de la citation, mots-clés des liens, CA apporté… site (cliquer sur des pubs, vendre, contribuer…)

33 34

Quelques exemples de sites Le référencement à l’international

• À partir de Google Analytics – Site fortement dépendant de la recherche • La présence à l’international demande : • Avant tout une réflexion sur un marché, une chaine – Blog en développement logistique, un environnement juridique … différents – Portail spécialisé • Un top level name (.fr, .de, .ru) TLD local peut être – Site de projet d'élèves de Centrale utile (Une déclaration idoine sous Google Outils pour les Webmasters est également utile, mais un site multilingue est à – Site de cours en licence libre déconseiller). • Une vitesse de consultation adaptée (hébergement dans le pays ?).

35 36

6 Autres manières de capter du trafic Les thèmes et chapitres du cours

Elles sont multiples.. 1. Origine du SEO, Google … et ses concurrents – Campagnes Email 2. La fréquentation d’un site : les fondamentaux – Affiliation 3. Dans la peau d’un moteur de recherche : le PageRank • Afficher des produits en échange d'une commission sur les ventes 4. Web Analytics et liens commerciaux – Cadeaux à des bloggeurs influents 5. Optimisation du référencement – Comparateur / Comparison Engine – “Onpage” – “Onsite” – Nouveaux vecteurs = réseaux sociaux, community management – “Offsite” • Facebook 6. Trouver et optimiser les mots-clés • Twitter 7. Méthodologie de référencement et avenir du •… SEO

Image : Source 37 38

3- Dans la peau d’un moteur de Questions ? recherche : le PageRank

Cours distribué sous licence Creative Commons, selon les conditions suivantes :

Source des images indiquées au-dessous ou en cliquant sur l’image Rémi BACHELET Enseignant-chercheur, Ecole Centrale de Lille

39 Image : Source 40

Le PageRank

• « Vote » d’une page pour une Les algorithmes de autre – PR (C) > PR (E), même avec classement des pages moins de liens ! • Échelle logarithmique 0-10 – La barre d’outils Google permet 1. Le PageRank d’en visualiser une approximation • Modalités de calcul – Avoir un PR de 3-4 c’est déjà beaucoup • Fiabilité : Le TrustRank • Un processus de calcul récursif • Réponse à une requête : Le SERP Rank – Pour éviter que le PR →∞ , il faut un amortissement = Damping factor (typ. 85% - ici il est de 90%).

41 Image : Source Wikimedia Commons 42

7 Ranking : études de cas Le TrustRank

• Méthode semi-automatique pour détecter les pages de spam = classification "spam ou pas spam" (Trust = confiance). • Principe : une page « propre » ne propose pas de liens vers des pages de spam ( Le terme TrustRank vient de Yahoo!).

• http://freemind.sourceforge.net/wiki/index.php/Main_Page 1. Amorçage : établir une liste de pages « propres » de référence • http://freemind.sourceforge.net/wiki/index.php/Talk:Main_Page – Après une analyse « humaine ». – On n’a pas forcément besoin d’une grande liste (p.e 200 sites). • https://sourceforge.net/projects/freemind/files/freemind-unstable/ 2. Suivi récursif des liens de la liste d’amorçage 3. Degré de confiance que l'on peut attribuer à la page : un indice – Plus les liens sont forts avec des pages de référence, plus leur degré de confiance est élevé • http://www.google.fr/search?hl=fr&q=achat+fleurs – C’est le TrustRank (ou TR), indice entre 0 (=spam) et 1 (=page de référence)

• Le TrustRank peut être utilisé : – pour filtrer l'index d'un moteur de recherche, – pour classer les résultats d'une recherche.

43 44

L’algorithme du PR : un secret Quelques-uns des 200 bien gardé paramètres du calcul du ranking

1. Sur la page (« onpage ») Un nombre important de facteurs est pris en compte – Ancienneté / Fréquence d’actualisation dans le PageRank. – Texte = visible sur la page / Code = Meta tags = non visibles sur la page – Ces facteurs sont très nombreux (plus de 200 d'après 2. Sur le site (« onsite ») Google). – Lien internes, arborescence (« Breadcrumbs ») – Leur nature et leur pondération sont secrets pour – Paramétrage sur Google outils pour les webmasters (Sitemap..) limiter les chances de manipulations (et la concurrence 3. Hors du site (« offsite ») des autres moteurs de recherche). – Liens entrants en partie visibles via link:http://fr.wikipedia.org • Leur PageRank, Âge, TrustRank de la page – Le terme "PageRank" est une marque déposée et a • Social bookmaking, tweets… été l’objet de brevets, à commencer par ( U.S. Patent • Google utilise t-il les données qu’il stocke sur le comportement des 6,285,999 ). Le brevet appartient à Stanford University internautes pour le calcul du PageRank ? et Google en a l’usage exclusif. – Temps passé sur le site, statistiques renvoyées par la barre d’outil google, – Beaucoup de spéculations sur ce sujet, voyons annotations sidewiki, citations d’URL dans gmail, requêtes avec l’URL du site, marque-pages Google, âge/sexe/localisation des internautes, leurs quelques-uns des paramètres connus… recherches précédentes …. les licences de ces services précisent souvent que non..

45 46

Le SERP Rank La Google Dance

• Période durant laquelle Google met à jour C’est l’ordre de présentation des liens lorsque l’on le classement des pages référencées. entre des mots-clés dans un moteur de recherche – On la remarque par certains éléments :  La page de résultats présente une liste ordonnée de • Nouveau PageRank liens vers des pages/images/vidéos, associés à des • Variation de position d'une page sur un mot clé, textes courts (snippets ) • Variation du nombre de pages indexées d’un site. • Le SERP Rank est fonction du PageRank, mais • La Google Dance n'existe plus ! Le aussi de facteurs liés aux mots-clés. processus d’actualisation est désormais – Voir le chapitre 6 sur les mots-clés et leur mise en valeur continu. – SERP = Search Engine Results Page

47 48

8 Les thèmes et chapitres du cours Questions ?

1. Origine du SEO, Google … et ses concurrents • Plus d’informations sur les lien- 2. La fréquentation d’un site : les fondamentaux retours/ 3. Dans la peau d’un moteur de recherche : le • Mathématiquement, le PageRank est la PageRank 4. Web Analytics et liens commerciaux probabilité stationnaire d'une chaîne de 5. Optimisation du référencement Markov , c'est-à-dire un vecteur de Perron- – “Onpage” Frobenius de la matrice d'adjacence du – “Onsite” graphe du Web [1] ,[2] – “Offsite” 6. Trouver et optimiser les mots-clés

7. Méthodologie de référencement et avenir du Rémi BACHELET SEO Enseignant-chercheur, Ecole Centrale de Lille

49 50

4- Liens commerciaux et Web Chapitre 1/2 Analytics Le référencement commercial

1. Le marketing par les moteurs de recherche 2. Les liens sponsorisés • Avantages/inconvénients • Enchères Cours distribué sous licence Creative Commons, selon les • Limites du référencement commercial conditions suivantes :

Source des images indiquées au-dessous ou en cliquant sur l’image

Image : Source51 52

Les deux grands types de Référencement organique vs. liens facturation de la publicité sur sponsorisés

internet Liens sponsorisés 1. Paiement au clic Pay Per Click (CPC = Cost Per Clic)  Le plus fréquent 2. Paiement à l'impression Pay Per Impression = à l’affichage Résultats (CPV = Cost Per View) organiques  Totalement dominant jusqu’aux années 2002+

Liens sponsorisés 53 Image : www.finalsite.com 54

9 Avantages / inconvénients des liens Les liens sponsorisés, c'est… sponsorisés : • Avantages : • Des millions de recherches par jour – Réactivité = opérationnel en 15 Minutes • Une publicité ciblée : ils correspondent à la – Paiement au clic donc : demande de l'internaute à ce moment-là • Plus d’argent = plus de trafic • On se fixe le coût maximum acceptable, le budget.. – Sont souvent plus suivis que les liens naturels (80% ?) – 55% des achats en ligne démarrent à partir d'une recherche – Des services de web analytics associés permettent de (Source: Internetstats.com) suivre le retour sur investissement. • Inconvénient • Un retour sur investissement calculable au – Dépendance : arrêt du trafic si arrêt des campagnes centime près … (contrairement au référencement naturel, on n’a pas d'effet durable).

55 56

La vente aux enchères du prix par clic Lecture des pages web

Origine de l’image : http://www.oxatis.com 57 Image : http://www.useit.com 58

Gestion des campagnes Retour sur investissement

• À partir d’un budget donné, on pourra prendre 2 régies • Combien ça coûte ? publicitaires : • Cout Par Clic fonction des enchères • Search sur Google Adwords, • Yahoo Search / Microsoft Adcenter. • Combien ça rapporte ? – Pour chaque campagne : • Nombre de recherches de votre mot-clé • Étude sémantique/marketing... – Quelle est la valeur des mots-clés ? Leur prix d'achat acceptable ? X % de clics vers votre site (p.e. 2%) • Rédaction des annonces/groupes d’annonces X taux de conversion (achat/visites) • Mise en place et suivi des enchères • …et optimiser le budget publicitaire X votre marge sur l’achat effectué – Piloter les campagnes en fonction : • Attention à faire de la veille : • Des objectifs à atteindre : fréquentation, conversion… • Du retour sur investissement (ROI) – Pour noël 2008, un jeu à succès “Harry Potter Game” – Attention n'avait pas de gros revendeurs référencés dans les • Valider la mise en place des trackings avant le lancer résultats de recherche … – CA = millions !!

59 60

10 Limites du référencement Chapitre 2/2 commercial • Crédibilité de la publicité – De moins en moins importante.. 10% des consommateurs feraient confiance à la publicité Les outils du Web Analytics – Deux catégories de liens sponsorisés contextuels • Liés aux mots-clés tapés sur un moteur de recherche : nous venons d’étudier Google AdWords • Mais il est également possible d’acheter des mots-clés affiché par des sites web (ou gmail) et liés au contenu de la page vue : pe google AdSense 1. Google Analytics • Mais une grande partie des internautes tenteraient de 2. Google Webmasters Tools bloquer les publicités – Ou : Google outils pour les webmasters – Avant : des logiciels payants adsubstract – Maintenant : des extensions gratuites adblock sous Firefox • Les liens sponsorisés contextuels ont un meilleur taux de conversion que la publicité traditionnelle – 6 fois meilleur qu'une publicité "image" classique

61 62

Google Analytics

 Suivre la provenance des visiteurs  Améliorer la conception et le contenu du site  Optimiser les campagnes marketing  Comparer les indicateurs / benchmarking  Alertes automatiques / personnalisées

• Quels mots clés attirent les prospects qui dépensent le plus ? • Quelle variante de l’annonce a déclenché le plus de clics entrants ? • Page de destination la plus rentable ? • Abandons : Quels éléments poussent les visiteurs à abandonner leur navigation ? • Y-a-t-il un problème technique sur mon site ?

Origine de la page : http://www.oxatis.com 63 Origine de l’image : http://www.oxatis.com 64

Alertes automatiques

Origine de l’image : http://www.oxatis.com 65 Origine de l’image : watchingwebsites 66

11 Entonnoir de conversion Google webmasters tools

• Permet de suivre – L’indexation de son site • Soumettre une sitemap • Connaître la dernière date de passage du • Liste des erreurs, liens morts etc.. détectés par le robot – Positionnement du site sur les 10 principaux mots- clés/expressions-clés – Impressions = nombre de recherche où la SERP affiche le site – Clic = nombre de clics amenant au site – Liste des sites donnant des backlinks • Plus exhaustive qu’une recherche link:http://monsite.com • Autres outils utiles • Google guidelines liste de bonnes pratiques conseillées. • Yahoo! Site Explorer est analogue à GWT

Origine de l’image : http://www.oxatis.com 67 68

Nouveaux outils de mesure Questions ?

• Plus d’informations sur Google Outils pour les webmasters (Google Webmaster Tools) • Fonction " Analyser comme Googlebot " de Google Outils pour les webmasters • Voir aussi Introduction à l’étude d’impact • Radian6 est un outil automatisant la veille sur la Toile. indexe de multiples sources : blogs, titres de presse, réseaux sociaux..

Origine de l’image : http://www.alenty.com/xwiki/bin/view/Demo/ExpositionPublicitaire 69 70

Les thèmes et chapitres du cours Questions ?

1. Origine du SEO, Google … et ses concurrents 2. La fréquentation d’un site : les fondamentaux 3. Dans la peau d’un moteur de recherche : le PageRank 4. Web Analytics et liens commerciaux 5. Optimisation du référencement – “Onpage” – “Onsite” – “Offsite” 6. Trouver et optimiser les mots-clés

7. Méthodologie de référencement et avenir du Rémi BACHELET SEO Enseignant-chercheur, Ecole Centrale de Lille

71 72

12 5- Cours de référencement : Chapitre 1/3 optimisation Optimisation “Onpage”

1. Texte : visible sur la page 2. Code : non visible sur la page

Cours distribué sous licence Creative Commons, selon les conditions suivantes :

Source des images indiquées au-dessous ou en cliquant sur l’image

Image : Source73 74

Choix du titre de la page Rédaction du texte

• Le titre est : • Voir le chapitre sur les mots-clés – L’« image de marque » qui apparaît sur le snipet de la page de résultats de recherche. • Le cloaking (texte caché visible pour le robot indexeur, mais • C’est le texte du lien, • Le reste de la description étant le meta tag meta name="description" .. ou sinon les premiers mots de invisible par le lecteur) a suscité beaucoup de la page, sa date.. – Le mot-clé le plus fort pour le robot indexeur tentatives pour leurrer les moteurs de recherche • Entre 7 et 10 mots – Techniques : Meta tags, identification des images, texte blanc sur fond blanc, caché derrière une image, balise

, noframes, noscript, display:none .. – Éviter les termes « tarte à la crème » ( "page", "bienvenue"…) – Un titre propre à chaque page • Le titre doit reprendre les mots clés importants ⇒ Les robots détectent de plus en plus les – Il donne un résumé de la page (éviter les pages multi thèmes) données cachées, – De plus en plus détaillé quand on descend dans l’arborescence du site ⇒ Ils baissent le TrustRank des pages – Pas de titres/pages multilingues

75 76

Le code : Meta Tags rel="nofollow" Meta = des “données sur les données” – Permet au webmestre de spécifier que ce lien ne doit pas titre de la page compter dans le PageRank – Balise inventée en 2005, notamment par un "responsable antispam" de Google – Les autres moteurs de recherche se sont ralliés au système • Pour un indexeur on considère par ordre d’importance – Devrait plutôt s'appeler rel="nopagerank" , car le lien est suivi 1. titre de la page par les indexeurs 2. META name="description 3. META name="keywords – L’utilisation de cette balise a donné lieu à des tentatives de manipulation (pageRank sculpting) • • Prévient le spamdexing , notamment pour les sites – all : Le robot indexe tout (= défaut) – Ouverts aux commentaires – none : Le robot n'indexe rien du tout • Forums de discussion, commentaires de blogs – De crowdsourcing – noindex : Votre page n'est pas indexée mais les liens sont suivis • Wikis… – nofollow pour toute une page ou comme attribut de lien : voir diapo suivante

77 78

13 Chapitre 2/3 L’optimisation de page multivariables Optimisation “Onsite” Ou Multivariate landing page optimization • On teste divers éléments visibles d’une page – x Images différentes, y dispositions du texte, z 1. Structure du site formulations 2. Fichiers spéciaux – On obtient x*y*z combinaisons possibles – Robots.txt, – Sitemap.xml – On évalue leur taux de conversion 3. Choix techniques – Google Optimizer

79 80

Eventail d'opérations d'optimisation Structure du site d’un site – Ergonomie = Facilité de lecture du site pour un internaute • Règle des "3C" : • Plan du site • Navigation – Contenu – Breadcrumbs France > Normandie > Calvados > Deauville – Code – Facilité de lecture du site pour un indexeur – Conception, • Fonction " Analyser comme Googlebot " – Intérêt des CMS pour mettre à jour la structure • Wordpress, Joomla, Magento…

81 82

Fichiers spéciaux Choix techniques

• Robots.txt – Spécifie aux robots indexeurs le comportement • Réécriture d'URL qu’il doivent adopter – http://www.discounteo.com/tv-video/televiseur/tv-lcd • Indexer ou pas, suivre les liens etc.. • Cas du Flash • Sitemap.xml – Désormais indexé par Google dans certains cas. – Cartes des pages du site à visiter • Cas des sites dynamiques • Fichier d’identification – Facteurs pénalisants et de leurs solutions – Pour valider par Google qu’on est bien le (frames, formulaires, AJAX, JavaScript, sessions, responsable d’un site. contenus dupliqués, etc.)

83 84

14 Extensions Firefox utiles pour auditer un site

– Barre d’outils google • PageRank – Firebug Le plus important … • Vérifie l’exécution du code, notamment pour les outils de web analytics en java – IE tab • Aspect de la page sous IE – .. et beaucoup d'autres…

85 86

Chapitre 3/3 CONTENT IS KING « le contenu c’est ce qui compte avant tout » Optimisation “Offsite” / Netlinking Contenu = le texte visible par le lecteur, mais aussi les médias (images, vidéo) , la facilité de navigation, l’ergonomie/ affordance , l’interactivité, au global • Le site dans l’écosystème du web l’expérience du site.. • Backlinks Symptômes d’une faiblesse de contenu : • Social bookmarking • Taux de rebond = les internautes ne restent pas sur le site • % élevé de nouveaux visiteurs = pas de retour • Peu d’entrées directes (pas de mémorisation du site en marque-pages) •…

87 88

Les backlinks

• Les liens vers votre site sont le facteur le CONTENT IS KING plus important du référencement naturel – Sauf via des sites de spam, de TrustRank faible… LINKS ARE QUEEN • Ces liens sont plus efficaces s’ils viennent de sites • Couvrant le même domaine • À fort PageRank – Échange de liens • Plus efficace s'ils ne sont pas directement réciproques

90

15 Efficacité des liens Le Netlinking

• Rechercher des partenaires pour augmenter le ranking du site. – Cet aspect prend de plus en plus d’importance, la gestion des Les mots-clés dans les liens sont plus ou moins partenariats est un élément clé pour ce poste. pondérés – Les fonctions du référenceur s’approchent ici de celles de community manager . – Moins efficace : • Types de liens : • Cours de référencement ici. – liens de ressources : pointent vers des ressources utiles – Efficace : – Liens réciproques : p.e. le site A pointe vers B, qui pointe vers A en • on y propose un cours de référencement . échange. Des annuaires d’échanges de liens peuvent aider à la mise en contact. – Encore plus efficace : – Spam de liens : p.e. p.e. Un robot insère des commentaires dans les • on y parle de la cours de référencement . Stratégie neutralisée par les balises nofollow . – Liens internes : p.e. toutes les pages du site affichent un lien vers la page principale.

91 92

La déclaration aux moteurs de Les annuaires recherche • Un référencement dans un bon annuaire compte plus qu'une myriades de pages mineures. • Ajouter l'URL de votre site à Google • Yahoo directory – Seule la page de premier niveau d'un site est à soumettre (« to submit ») • DMOZ – Obstacles: – Il n'est pas nécessaire d'indiquer les liens mis à jour ou obsolètes. Les liens désactivés disparaissent au • Difficile de se faire accepter cours de l'exploration suivante – Gérés par des opérateurs humains, souvent des volontaires (DMOZ) – Voir aussi dans le chapitre "outils" – Formulaires complexes, délais … • … Google webmasters tools. • Attention aux faux annuaires / spamdexing

93 94

Référencement et Web 2.0 Synthèse : White Hat ou Black Hat ? Black Hat : Manipuler les moteurs de recherche… au risque du bannissement des résultats de recherche White Hat : Contenu de qualité,  Occultage (transmettre une page différente au site agréable et pertinent pour l'utilisateur moteur de recherche et au visiteur)  Optimisation des mots-clés  Texte caché (Cloaking) raisonnable  Stratégie de netlinking honnête  Répéter abusivement un mot-clé, mots- (=non rémunérée) clés sans rapport avec le contenu réel  Ne pas exiger de résultats (Keyword stuffing) immédiats (effet sandbox)  Rien à cacher  Pages en double / contenu copié-collé d’autres sites (Scraper site) Rien qui cherche à tromper  Achat abusifs de noms de domaine l’internaute ou les moteurs de recherche (Cybersquatting, Domain spam)  Utilisation ciblée des balises nofollow (PageRank sculpting).  Globalement, le spamdexing Voir également le lexique en fin de cours...

95 Image : Source96

16 Questions ? Les thèmes et chapitres du cours

1. Origine du SEO, Google … et ses concurrents 2. La fréquentation d’un site : les fondamentaux 3. Dans la peau d’un moteur de recherche : le PageRank 4. Web Analytics et liens commerciaux 5. Optimisation du référencement – “Onpage” – “Onsite” – “Offsite” 6. Trouver et optimiser les mots-clés 7. Méthodologie de référencement et avenir du SEO

97 98

Questions ? 6- Cours de référencement : mots- clés et écriture de page

Cours distribué sous licence Creative Commons, selon les conditions suivantes :

Rémi BACHELET Source des images indiquées au-dessous ou en cliquant sur l’image Enseignant-chercheur, Ecole Centrale de Lille Image : Source 99 100

L’audit de mots-clés, pourquoi ?

Trouver et optimiser les mots-  Pas de SEO possible sans un travail fin sur les mots-clés – Le ranking n’a aucun sens dans l’absolu Seul compte la SERP, le résultat d’une recherche sur les mots-clés entrés clés par les prospects (= les personnes auxquelles le site s’adresse). – Attirer n’importe quel trafic ne sert à rien dans 95% des cas » coût de la bande passante » fort taux de rebond = internautes déçus » voire sanction (retrait des résultats de recherche = baisse de ranking Google SearchWiki).. 1. L’audit de mots-clés – Le design/audit/veille de mots-clé permet de repenser/recadrer un site • Déterminer ses objectifs  Objectif de l’audit de mots-clés - la sélection de mots ou groupes de • Se mettre à la place du client mots selon deux considérations : 2. Outils de recherche de mots-clés 1. L’adéquation aux objectifs du site (pe conversion) • 2. La concurrence • Les mots-clés « lourds » .. et la longue traine • est-il réellement possible de conquérir une bonne place sur ce mot-clé ? 3. Placement efficace des mots-clés

101 102

17 Un préalable : fixer l’objectif Dans la tête .. du client qui recherche ce que vous proposez Qu’est-ce qui est attendu du site ? – Plus de clients ? Étapes : – Plus de clients certes, mais à quelle phase du cycle d’achat ? 1. Quelles questions l’internaute se pose t-il ? • Trois visites avant un achat, chacune avec des questions différentes.. 2. .. Et donc : quelles recherches 1. « Peut-on lire les blu-ray sur un ordinateur ? » tape-t-il ? 2. « Le modèle PCXXX lit-il les blu-ray ? » 3. Compiler les mots et phrases-clés 3. « Acheter modèle PCXXX avec option blu-ray » correspondantes, chercher les – Une certaine réputation / image de marque ? variantes, le nombre de – Positionnement sur des catégories de clientèle spécifiques ? recherches … – Une clientèle « branchée » n’utilisera pas les mêmes mots-clés, que 4. Les prioriser et les trier. les jeunes, les seniors etc… – Plus de visites ? Le processus est analogue à celui • Viser des mots-clés à fort trafic et faible concurrence présenté dans ma formation au brainstorming .

Image – Source : Elliance, Search Engine Land, Oct. 23, 2007

103 104

Outils de recherche de mots-clés Google Trends (1/2)

• Dictionnaire des synonymes (ou maj-F7 sous MS Office) • Sites spécialisés Google – Trends • http://www.google.com/trends • Voir ci-après – Générateur de mots clés • https://adwords.google.com/select/KeywordToolExternal  Étude des prix des enchères pour l’achat de mots-clés – Wonder Wheel • http://www.googlewonderwheel.com/ • Microsoft’s adCenter Labs keyword forecast • http://adlab.msn.com/Keyword-Forecast/

105 Recherche-source 106

Google Trends (2/2) Générateur de mots clés Google

107 Site-source 108

18 Google Wonder wheel Nombre de mots clés saisis sur les moteurs de recherche

• 1 seul mot : 13 % (donc requête contenant plus d’un mot : 87% : = 6 fois plus )

– 2 mots : 28 % – 3 mots : 27% – de 3 à 5 mots : 52 % – de 4 à 10 mots : 31 % (source : rankstat.com, chiffres arrondis)

Recherche-source 109 110

La longue traîne

– …. et la longue traîne (Long Tail) : Une recherche typique est de 3 mots • Suivre les accès au site ( Web analytics ) : – La plupart des recherches des internautes accédant au site vient : • Des combinaisons et permutations de mots-clés • De mots-clés qui sont dans le texte, mais paraissaient peu importants • De variantes (pluriel, fautes d’orthographe, coquilles…) • Pour une variante, le trafic est faible, mais la quantité de combinaisons est telle qu’elle pèse aussi lourd que les mots- clés « star ».

Image : Source 111 112

Exemple de longue traine de mots- Étudier les mots-clés « lourds » clés

• Pour chaque page d’entrée, étude – interne = Google Analytics – externe = Trends, Google Wheel • On en apprendra plus : – sur ce qui se passe dans la tête des prospects – sur le fonctionnement réel du site –… • On quantifiera rigoureusement pour confirmer ou infirmer un positionnement visé – Attention à ne pas tirer de conclusions hâtives sur des effectifs faibles

113 114

19 Rédaction et placement efficace Les thèmes et chapitres du cours des mots-clés • Typographie –

titre avec mots-clés importants

, idem h2, 1. Origine du SEO, Google … et ses concurrents h3… – Ou en gras … 2. La fréquentation d’un site : les fondamentaux • Mots-clés importants en tête de page... et de phrase 3. Dans la peau d’un moteur de recherche : le – Moins efficace : “de nombreux domaines sont concernés (bla bla bla bla bla bla bla bla) par la gestion de projet .” PageRank – Plus efficace : “la gestion de projet comprend de nombreux domaines, 4. Web Analytics et liens commerciaux dont…” • Répéter sans abuser, mais quand même … 5. Optimisation du référencement – Efficace : “la gestion de projet a évolué depuis 1970. Les outils de – “Onpage” gestion de projet sont notamment…” • Mettre les mots-clés liés à proximité les uns des autres – “Onsite” – Moins efficace : “la gestion est un point majeur des projets” – “Offsite” – Plus efficace : ““la gestion de projet est un point majeur ” 6. Trouver et optimiser les mots-clés • Mettre les mots-clés dans le nom du site – Plus efficace : http:// gestiondeprojet.com 7. Méthodologie de référencement et avenir du SEO

115 116

7- Cours de référencement : Questions ? méthodologie et synthèse

Cours distribué sous licence Creative Commons, selon les conditions suivantes :

Source des images indiquées au-dessous ou en cliquant sur l’image Rémi BACHELET Enseignant-chercheur, Ecole Centrale de Lille

117 Image : Source118

Chapitre 1/2 Stratégies de référencement Méthodologie

1. Audit Méthodologie de référencement • Évaluer les sites concurrents, élaborer une stratégie, examiner les mots-clés, trouver sa valeur ajoutée 2. Conception • Développer le site, l’optimiser 3. Référencement • Soumission, netlinking… 4. Optimisation / Suivi • Un processus continu de web analytics, de mise à jour et d’amélioration

119 120

20 Chapitre 2/2

En conclusion…

1. Les huit commandements du SEO – Quels critères pour savoir qu’on a réussi ? 2. Avenir du SEO 3. Lexique

Image : Source121 122

Les huit commandements du SEO Qu’est-ce que la réussite ? • On a réussit lorsque : 1. Le ranking n’est pas une fin en soi, il faut savoir ce 1. Les gens viennent sur le site (Référencement, netlinking …). 2. Restent pour le consulter (Taux de rebond) que l’on souhaite en faire 3. Agissent de la manière attendue = conversion 2. Connaître et surveiller ses concurrents Taux de conversion = – taux de conversion online = Achat en ligne, inscription, abonnement 3. Concevoir ses pages et son site avec soin « dans la à une newsletter, téléchargement… peau d’un robot indexeur » : mots-clés, titres etc… – … + taux de conversion offline = recherche du magasin le plus proche appels téléphoniques, fréquentation d’un magasin, achat… 4. Mais se rappeler que « content is king » 4. Sont fidélisés = Mettent l'adresse du site dans leurs favoris, reviennent, 5. Links are queen : établir une politique de liens s’abonnent (Mise à jour de l'information, pull/push, RSS...). 5. Le recommandent à leurs connaissances (Social bookmarking, marketing 6. Embaucher des experts.. ou travailler dur viral...). 7. Pas de résultats garantis ou stables : un suivi • Le facteur principal de promotion d'un site est son utilité, son permanent contenu, content is King 8. Ne pas dépenser tout son temps/budget à concevoir Le référencement est donc nécessaire mais pas un site, il faut des ressources pour le référencement suffisant . et le suivi

123 124

Avenir Pour en savoir plus

• Internet mobile, géolocalisation • Références développées sur le site • Image search optimization , recherche de vidéos • Social media optimization , marketing viral sur • Essentiellement wikipédia en anglais Facebook (1.7 MM$ en 2011, selon Emarketer ) – http://fr.wikipedia.org/wiki/Web_Analytics • Mondes virtuels, microsites,. • Olivier Andrieu Présentation du 22 octobre 2007 - Skooiz Montréal • La fin du ranking ? – « Ranking is dead » thèse de Bruce Clay en 2008, à – http://www.abondance.com propos des SERP de plus en plus adaptées à l’internaute (géotargetting, historique des consultations…)

125 126

21 Les thèmes et chapitres du cours Lexique

1. Origine du SEO, Google … et ses concurrents • Spamdexing : tromper les moteurs de recherche sur la qualité d'une page ou d'un site afin d'obtenir, pour un mot-clef donné, 2. La fréquentation d’un site : les fondamentaux un bon classement dans les résultats des moteurs. Par 3. Dans la peau d’un moteur de recherche : le exemple : – Link farm (ferme de liens) un groupe de sites web donnant des PageRank liens les uns vers les autres, souvent créés par un automate 4. Web Analytics et liens commerciaux – Cloaking (occultage) : présenter des résultats différents selon le logiciel utilisé pour afficher la page: une page anodine pour un 5. Optimisation du référencement navigateur web, une page optimisée, remplie de mots-clefs, – “Onpage” réservée aux robots des moteurs • Google bombing (bombardement Google) exploite le poids – “Onsite” accordé au texte d’un hyperlien. Si plusieurs sites utilisent le – “Offsite” même texte pour pointer sur la même cible il devient possible de le faire apparaître en tête de la SERP (p.e. « fils à papa » 6. Trouver et optimiser les mots-clés renvoyait en premier résultat le site Web de Jean Sarkozy.). 7. Méthodologie de référencement et avenir du SEO

127 128

Questions ?

Rémi BACHELET Enseignant-chercheur, Ecole Centrale de Lille

129

22