A
l'occasion de la planification de mise à jour et de nouveaux
développements sur différents sites internet nous nous sommes convaincu
de la nécessité d'effectuer une analyse détaillée des données
statistiques de base, ceci afin de mieux cerner le comportement des
visiteurs et des moteurs de recherche. Au vu des résultats obtenus nous
avons choisi de rendre cette étude publique tant pour bénéficier de
feedback et compléments de la part de professionels avertis que pour
partager nos observations et conclusions avec la communauté des
webmasters amateurs. Le site étudié,
GuideVTT.com nous parait particulièrement adapté à ce type de travail pour les raisons suivantes:
- Il s'agit d'un site non commercial pour lequel la publication des statistiques n'est soumise à aucune restriction.
- le
site s'est développé de manière continue et régulière depuis plus de
trois ans, la stratégie SEO (Search Engine Optimization) consistant
simplement et uniquement à éviter les erreurs grossières. Du plus les
mises à jour et manipulations sur le site durant la dernière année sont
bien documentées.
- GuideVTT possède une thématique clairement
définie, centrée autour de la pratique du VTT en particulier avec
l'utilisation du GPS.
- Avec plus de 30'000 pages vues par
mois, la fréquentation du site ainsi que sa maturité sont suffisantes
pour permettre une analyse statistique significative.
- Finallement les données statistiques présentent des variations qui, a priori, ont excité notre curiosité!
Cet
article est séparé en différentes sections qui abordent chacune un
aspect particulier de la vie du site. Nous commençons par une revue des
mises à jour et événement significatifs sur la période
considérée, puis nous donnerons quelques précisions sur les
termes courammant utilisés dans les rapports statistiques standards
fournis par les hébergeurs.
Nous traitons ensuite les
statistiques globales (visites, pages vue, URL uniques etc...) avant de
nous concentrer sur le principal moteur de recherche, Google, et sur
l'évolution des visiteurs envoyés par son index. La section suivante
traite des différents mots clé amenant du traffic sur le site et plus
particulièrement de l'évolution de ces mots clé.
La dernière partie détaille le type de contenu consulté et ici encore l'évolution des sujets "visités" au cours des mois.
Finallement,
comme nous l'avons déjà mentionné, nous souhaitons que vous réagissiez
et que vous nous apportiez vos commentaires et compléments d'analyse
afin de tirer un maximum d'informations pertinentes de cet étude.
Historique
En parallèle à l'analyse des chiffres de fréquentation et des relations
avec les moteurs de recherche nous devons considérer la "vie du site".
Par rapport à la thématique, VTT - GPS on peut déjà extrapoler deux
tendances saisonnières:
- Une popularité accrue durant la période estivale, favorable à la pratique du VTT.
- Un intérêt particulier pour le contenu orienté GPS avant et pendant la période de Noël.
A ces caractéristiques saisonnières régulières et répétitives il faut
ajouter l'effet des mises à jour et autre événements majeurs qui ont eu
lieu durant la période étudiée. Voici les éléments que nous avons jugés
significatifs:
- Début juin: amélioration de la page
principale, avec un design renouvellé, une carte cliquable (choix des
parcours VTT) et des liens directs vers les différentes sections GPS.
- mi-juin: nouvel algorithme de google (bourbon)
- Début septembre: ajout de fichier kml et de google Maps pour tous les parcours.
- Mi-novembre:
nouvelle section (myGuideVTT) orientée web 2.0 où les membres
peuvent déposer leur enregistrements GPS pour les partager, générer des
cartes google Map, des fichiers 3D google Earth etc...
Définitions
Les données statistiques fournie par notre hébergeur sont enregistrées avec le système
Webalizer version 2.01. Voici quelques précisions sur les termes utilisés:
- Hits: Nombre total de requêtes faites au serveur durant la période définie (heure, jour, mois, année...)
- Fichiers: Nombre de requêtes qui aboutissent effectivement à l'envoi d'information à l'utilisateur.
- Visites:
Une visite est comptabilisée chaque fois qu'une requête effectuée par
un site distant abouti à l'envoi d'une page. Les sites distants qui
intégreraient des éléments tels que images, css, vidéo etc... ne sont
pas comptabilisés, ce qui permet de minimiser le nombre de "fausses"
visites.
- Pages:
cette variable comptabilise toutes les URLs qui correspondent
effectivement à une page (.htm, html, cgi,...) et non les éléments qui
la compose (images, audio,...)
- Site uniques: nombre d'adresse IP uniques qui ont effectué des requêtes au serveur.
- URL uniques:
Uniform Resource Locator - Nombre d'éléments différents, situés sur le
serveur et constituant le site, qui ont fait l'objet de requêtes
(pages, éléments graphiques, audio, css,...)
- Référents uniques: nombre d'URLs uniques qui ont effectué des requêtes au serveur.
Analyse globale
Dans
cette première section nous allons étudier les totaux mensuels de
visites, pages, sites uniques, url uniques, référents uniques. Les
premières carcatéristiques que nous cherchons à mettre en évidence sont
les tendances saisonnières mentionnées ci-dessus ainsi que les
répercussions des différentes mises à jour.

Le graphique 1 montre l'évolution du nombre de visites. Les prévisions
saisonnières sont difficiles à mettre en évidence, et clairement
"perturbées" par différents facteurs. En particulier l'introduction
d'un nouvel algorythme ("Bourbon") chez Google a eu un effet important
sur l'audience dès la fin juin 2005. En considérant les prévisions
saisonnières, représentées en traits tirés sur le graphique, et la
fréquentation réelle on estime à env. 30 % la diminution de
fréquentation due à Bourbon. A partir du mois d'août la courbe rejoint
une valeur qui semble représentative d'une évolution "normale" de la
fréquentation estivale. Au mois d'octobre l'ajout des cartes google
Map, des fichiers kml ainsi que des communiqués postés sur différents
forums de discussion ont généré une petite hausse de fréquentation.
La caractéristique la plus marquante apparaît en fin d'année où les
effets cumulés de Noël (et l'achat de récepteur GPS) et de l'importante
mise à jour de décembre ont provoqué une augmentation significative des
visites.

Le graphique 2 montre d'abord le nombre de "sites unique" i.e le nombre
d'adresse IP ayant fait des requêtes au serveur. Ce paramètre évolue de
manière similaire à la courbe des visites. Cependant l'analyse des
"sites uniques" est délicate car plusieurs visiteurs peuvent provenir
de la même adresse IP, un même visiteur peut également se présenter
sous différentes IP.
Les "URL uniques" représentent le nombre
d'objets différents constituant le site et qui ont fait l'objet
d'au-moins une requête durant la période considérée. Cette valeur
dépend de la taille du contenu du site (nombre d' "objets" disponibles)
et des pages effectivements parcourues par au-moins 1 visiteur. On
observe premièrement une légère croissance continue des "URL uniques"
durant l'années, ce qui correspond à la croissance du site et de son
contenu. Deuxièmement, supperposés à cette ligne de base, on observe
deux pics, l'un en juin l'autre en novembre:
- Pour le
premier nous supposons que la nouvelle home page introduite le 5 juin a
amélioré la visibilité de certaines sections du site (en particulier
celles consacrées plus spécifiquement au GPS) qui étaient jusqu'alors
restées "invisibles" pour de nombreux visiteurs.
- Le pic de novembre est bien plus marqué, et nous laisse perplexe quant à son origine!
La dernière courbe du graphique 2 montre l'évolution du nombre de
référents uniques, i.e. les pages web qui pointent sur un objet de
guidevtt.com. Cette courbe est très régulière, elle montre deux légères
hausses en parfaite synchronisation avec les tendances saisonnières.
Cette caractéristique n'est pas surprenante, davantage d'internautes
parlent de VTT en été (en particulier sur les forums de discussion) et
de même pour le GPS de randonnée avant les fêtes de Noël.

Le graphique 3 montre un paramètre très important pour estimer la
qualité et l' "accroche" du site: le nombre moyen de pages par visite.
Clairement on observe des visites plus approfondies de mai à août avec
plus de 6 pages par visite. Durant l'hiver par contre les internautes
passent plus brièvement sur le site avec une moyenne de 4 pages
environ. On note encore une grosse irrégularité en octobre que nous
attribuons à l'introduction des fichiers 3D kml et de l'outil Google
Map qui suscitent la curiosité des visiteurs et prolonge leur visite.

Le graphique 4 donne le pourcentage de fichiers récurrents.
Contrairement à ce que l'on pourrai supposer, ces fichiers n'ont rien à
voir avec les opérations de nettoyage à la serpillère. Le calcul est le
suivant:
1/100 (hits - fichiers )/hits.
La différence
hits - fichiers
représente une première approximation du nombre de fichiers déjà
présents dans le cache de l'internaute, qui a donc déjà visité le
contenu en question. Ainsi le pourcentage de fichiers récurrents est
une mesure de la fidélité des visiteurs, elle est plutôt réjouissante
dans le cas de GuideVTT.com.
Trafic en provenance de Google
Pour étudier l'impact des moteurs de recherche nous nous concentrons
évidemment sur le plus populaire du moment: Google. Le graphique 5
montre les visites envoyées par Google.fr, Google.ch, Google.com et
finallement le total de tous les index Google (francophones et non
francophones). La première observation tirée de ce graphique est la
similitude entre les différents index google (.fr .ch .com,...), le
nombre de visiteurs provenant des index francophones étant nettement,
et logiquement, plus important.

Le volume de visites provenant de ce moteur de recherche dépend
principalement de deux facteurs. Commençons par le moins influent: les
sujets, mots clés, à la mode chez les internautes. Autrement dit,
est-ce que la thématique du site correspond à un large public ou au
contraire à une catégorie niche, recherchée par très peu d'internautes (
pour trouver les requêtes populaire du moment). Ce facteur répercute également les tendances saisonnières déjà mentionnées.
Le second facteur, de loin le plus important, est le positionnement du
site dans l'index de Google. Chaque webmaster sait l'importance de la
présence de son site sur la première page, voir le trio de tête des
résultats d'une requête sur les mots clés par rapport auxquels il a
cherché à se positionner. Dans le cas qui nous concerne le site est
bien placé dans les index à l'exception des quelques semaines qui ont
suivi la mise à jour, dite "Bourbon", de l'algorithme du moteur (chutte
de juin/juillet 05). Il est un peu prématuré de discuter la tendance à
la hausse du mois de mars mais ça n'est pas impossible que "
Big Dady" y soit pour quelque chose!
Mots clés
Cette
partie de l'étude est celle qui nous a révélé le plus de surprises et
qui met en évidence les fluctuations du positionnement du site dans les
moteurs de recherche en fonction des mots clés utilisés. Nous avons
sélectionné 6 familles de mot(s) clé(s). Ils représentent les mots
simples ou combinaisons de deux mots les plus utilisés dans les moteurs
de recherche par les internautes qui sont arrivés sur GuideVTT.com
(voir graphique 6).

Alors que,
naïvement, on pourrait s'attendre à un classement stable et constant de
ces familles, il n'en est rien. L'analyse de ces familles révèle même
de fortes discontinuités. Un exemple, la combinaison "_VTT_suisse_" qui
est très stable sur l'essentiel de la période, disparait totalement en
décembre et janvier. D'autres combinaisons telles que "_GPS_mac_" ou
"_VTT_?_" (le ? remplace n'importe quel autre mot) révèlent de fortes
oscillations dont certaines sont attendues, par exemple pour la période
de Noël. On note également que la courbe correspondant à "_VTT_" n'est
aucunement couplée à celle de "_VTT_?_" et qu'elle a subi une forte
hausse au mois de novembre. Finallement mentionnons que si le mot
"_GPS_" ne fait pas partie des familles sélectionnées c'est qu'il est
très rare dans nos statistiques. GuideVTT.com est mal indexé sur ce mot
clé simple, il s'agit en fait d'un mot clé très concurrentiel, faites
un essai et voyez le nombre de sites commerciaux, comparateurs de prix
etc... qui occupent les premières places/pages!
Type de pages visitées
En
regroupant le contenu du site dans 7 catégories (cf graphique 7) on
peut mettre en évidence les sujets/pages qui présentent le plus
d'intérêt pour les visiteurs.

On est pas surpris de constater que les catégories "introduction +
index + liste de parcours VTT" (rouge) ainsi que les "détails des
parcours" (vert) se calquent sur la courbe du nombre total de visites
mensuelles. Les catégories "liens" (brun) "offices du tourisme"
(bordeau) et la récente section "membres" (violet) sont des pages
logiquement moins fréquentées. Plus intéressantes sont les courbes
concernant le "forum" (bleu) et toutes les pages "GPS" (cyan) qui
révèlent un croissance importante et stable tout au long de la période
étudiée.
Finallement ce dernier graphique met en évidence ce
qui nous parraît le plus important dans le développement d'un site
internet, et peut-être plus encore à l'aire de la "tentation" du web
2.0: le
contenu. Ce même
graphique pourrait en effet représenter, pour chaque catégorie, la
quantité de travail investie avec une pondération favorable pour les
efforts récents. Autrement dit les pages les plus visitées sont celles
qui ont demandé un travail conséquent, et de préférence entrepris
récemment. Puis les mois passant, l'effet s'estompe, des mise à jour
sont alors nécessaire pour préserver la dynamique de croissance.
Conclusion
L'analyse des données statistiques nous a montré l'importance du
contenu sur l'évolution de l'audience tant qualitative que quantitative
du site. Il apparait clairement que les pages à fort potentiel sont
celles qui ont nécessité le plus de travail de préparation et de
rédaction. Logiquement on peut supposer que les moteurs de recherche
tendent à favoriser ces pages, cependant s'ils échouent ou si
pour une raison ou une autre ce type de contenu disparait des index des
moteurs (voir l'épisode Boubon) les conséquences sur l'audience sont
assez sévères. Evidemment il s'agit de conséquences sur le nombre de
visites (quantitatives) et non sur la profondeur des visites
(qualitative).
Même si le site peut compter sur un groupe de
fidèles internautes qui ne passent plus par les moteurs de recherche
pour nous visiter, une présence "à une juste place" dans les index est
vitale pour renouveler ce groupe de visiteurs fidèles et en acquérir de
nouveaux.
Finallement nous sommes curieux de suivre
l'évolution de la toute nouvelle section myGuideVTT qui, pour la
première fois sur le site, offre à chacun la possibilité d'uploader ses
parcours GPS. Même si le look de cette section reste traditionnel,
l'idée de partage des parcours VTT et la technologie sous-jacente sont
orientés web 2.0. L'utilisation des Google Maps, les calculs
automatiques des carcatéristiques du tracé, et création des
fichiers 3D (kml) qui affichent le parcours directement dans Google
Earth sont des outils puissants qui facilite énormément la manipulation
des fichiers GPS. L'années 2006 nous dira si cette nouvelle orientation
est reçue favorablement ou non par les internautes et les moteurs de
recherche.
Merci d'avance de nous laisser vos commentaires
pour compléter ou corriger certains aspects de cet article, nous
souhaitons vivement que ces quelques observations puissent aider les
débutants et plus expérimenté sur la toile en quête d'une meilleure
audience.