Presse Agrume

Présentation de Google Analytics

février 9, 2009 par Julien  
Catégorie Analytique

Avant d’entamer une série d’article sur Google Analytics, je voudrais commencer par en faire une petite présentation.

Google Analytics est un service de Web Analytique basé sur les outils de la société Urchin Software Corporation racheté en 2005 par Google.

Sa première qualité est sa simplicité apparente. Il suffit de s’inscrire au service, copier le marqueur qui vous est fourni et la placer sur vos pages et vous aurez très vite tout un tas de données exploitables.

Mais en rester la ce serait passer à coté de ce qui fait toute la force de cet outil. En premier lieu, les toutes puissantes expressions régulières qui révèlent toutes leur force quand elle sont appliqués à l’impressionnant système de filtres que propose Google Analytics. Les profils sur lesquels vont s’appliquer ces filtres, mais aussi également les récents segments avancés et les rapports personnalisés qui permettent de sélectionner et croiser de multiples données avec une grande précision. Sans parler des valeurs personnalisées, du tracking d’événement, du module d’E-commerce ou de l’intégration automatique d’Adwords. Sans parler également non plus des prochaines features à venir comme l’intégration d’adsense ou l’API. Bref vous l’aurez compris j’aime beaucoup cet outil. Et nous aurons très prochainement l’occasion d’en parler plus en détail. :)

Je voudrais terminer en signalant une nouvelle assez récente que les lecteurs du blog d’Analytics n’auront pas manqués de noter. Des changements concernant la fonction _setVar(). En effet jusqu’à présent l’usage de cette fonction qui permet d’attribuer une valeur personnalisé avait pour effet malencontreux d’affecter le taux de bounce et le temps passé sur la page. (Ce qui pouvait ce comprendre dans certains cas, mais qui perdait son sens lorsque le setting se faisait au chargement de la page). Maintenant, si l’on peut dire, c’est réglé. Ne vous affolez pas si votre taux de rebond a grimpé en flèche depuis le 29 Janvier, c’est juste que le _setVar() n’a plus pour effet de l’annuler.

Google Adsense Premium

janvier 27, 2009 par Julien  
Catégorie Monétisation

google adsense premium

Présentation

Réservé aux gros éditeurs, le programme Adsense Premium* de Google augmente considérablement les possibilités qui leurs sont offertes et donc le taux de clics associé (Jusqu’à 500% selon certains [1]).

Cependant comme indiqué dans [2] :
“Google peut fournir (au compte-gouttes) les informations pour personnaliser les formats d’annonces. Il faut insister auprès du responsable commercial assigné au compte pour obtenir l’activation de certaines fonctionnalités.”

Le présent article a pour objectif de faire un tour relativement complet des possibilités qui peuvent être proposées avec ce programme.

Quelques exemples d’intégration

Priceminister

Avantages :
- Format custom des annonces
- Pas de liens Feedback.
- Texte cliquable.
- Pas d’intitulé “annonces Google“.

CBS Sports

Avantages :
- Format custom des annonces
- Pas de liens Feedback.
- Texte cliquable.

AOL

Avantages :
- Format custom des annonces
- Pas de liens Feedback.
- Texte cliquable.

Autres avantages du programme Adsense Premium

En plus de ces avantages, et cela va sans dire de l’ouverture en fenêtre externe des pages annonceur, le programme Adsense Premium offre des possibilités moins visibles mais pourtant extrêmement utiles.

La liste qui suit n’est pas exhausitive. Elle est issue d’articles présents sur Internet et du code de sites qui utilisent le programme Adsense Premium :

Mise en forme personnalisé des annonces.
Vu au dessus. Permet une meilleure intégration, et une augmentation du taux de clics.

Le ciblage des annonces.
Il est possible sous certaines conditions de fournir à Adsense une liste de mots clés pour lui voir renvoyer des annonces en rapport avec ces mots. Les avantages sont nombreux :

- Ciblage de marchés plus rémunérateurs.
- Non dépendance au contenu de la page.
- Possibilité de se positionner sur des termes associés mais moins concurrentiels.
- Possibilité de définir les annonces en fonction de la navigation du visiteur sur le site.

Possibilité de retirer le “Ads by Google”.
D’inscrire autre chose à la place, et / ou retirer le lien de feedback.

Possibilité d’afficher des adsenses sur des pages de contenu adulte ou jeux d’argent.
Présence également d’un mode safe pour s’assurer à l’inverse l’affichage d’annonces “acceptables”.

Amélioration notable du ciblage par section.
Pour rappel Google permet de cibler ou d’éviter l’analyse contextuelle de portions de pages à l’aide du morceau de code suivant :

<!– google_ad_section_start(weight=IMPORTANCE) –>
Texte…
<!– google_ad_section_end –>

Le programme premium développe cette possibilité en ajoutant le ciblage par section nommé. Le principe :

<!– google_ad_section_start(name=NOM_DE_LA_SECTION, weight=IMPORTANCE) –>
Texte…
<!– google_ad_section_end(name=NOM_DE_LA_SECTION) –>

Il est ainsi possible de lier une annonce à une section nommée.
Ainsi les annonces peuvent être fonction des morceaux de page, et non plus des pages entières.

Négociation du partage des revenues adsense.
Il semble également que pour les gros éditeurs la part des gains Adsense puisse se négocier [3].

Conclusion

Nous venons de faire un tour rapide présentant les principaux avantages du programme. A noter également que chaque ensemble d’annonce au format premium doit d’abord être soumis au gestionnaire de compte Adsense avant validation. De plus ces fonctionnalités ne sont pas incluses par défaut mais doivent être négociés.

Références

[ 1 ] - How Adsense Premium Publishers Boost their CTR by 500%.
[ 2 ] - Google Adsense - étude de fonctionnement.
[ 3 ] - The privilege of being an Adsense Premium Publisher.

*note : Le programme adsense premium n’existe plus en tant que tel mais ces fonctionnalités peuvent toujours se négocier (pour les très gros éditeurs).

Le G2 d’HTC - Sous Google android

décembre 29, 2008 par Julien  
Catégorie High-Tech

Enfin un iPhone killer ! Un vrai. Oubliez le Blackberry Storm, le HTC Touch HD, ou le Nokia 5800. La future merveille de chez HTC, le G2 est bientôt la.

Tout les caractéristiques sont la pour en faire un bête de concours. Androïd de Google bien sur, un écran de 3,2 pouces, un appareil photo 5 Mégapixels avec flash et autofocus, un capteur en facade pour la visio, le WIFI, Bluetooth, EDGE, et surtout un design de toute beauté qui dépasse largement celui du premier GPhone du même HTC.

Bref, le G2 motorisé par Androïd est une merveille qui devrait sortir aux US courant Janvier. Vivement qu’il arrive en France.

Quelques shoots pour le plaisir des yeux

Le cloaking, inutile ?

décembre 29, 2008 par Julien  
Catégorie Référencement

Présentation

La technique du Cloaking (en français dissimulation) est une technique utilisée par les black hat pour optimiser leur positionnement dans les moteurs de recherche. [...] Le seul usage légitime qu’il peut être fait de cette technique est de proposer seulement aux clients qui peuvent l’interpréter des contenus spécifiques (par exemple, un contenu Adobe Flash n’est pas lisible par un robot). Aujourd’hui, de meilleures méthodes d’accessibilité sont à disposition, rendant le cloaking inutile.” Source : Wikipedia.

Le cloaking est une technique légitime de référencement consistant à proposer deux versions d’une même page selon que le visiteur soit un robot ou un humain. Si le cloaking à mauvaise presse il n’en est pas moins vrai que de nombreux sites très connus et bien classés dans Google l’utilisent à bon escient.

Mais d’abord techniquement, le cloaking, comment ça marche ?

Le premier problème qui se pose lorsqu’on veut réaliser un bon cloaking est de réussir à bien identifier Googlebot (Et les autres robots). Il existe plusieurs méthodes avec chacune avantages et inconvénients.

Identifier Googlebot grâce à l’user-agent :
Lorsqu’une application se connecte à un serveur web, elle envoi généralement dans sa requête HTTP un entête “user agent” contenant une chaîne de caractères permettant de l’identifier. Il suffit donc pour détecter Googlebot d’examiner l’user agent.

La darkseoteam analyse en permanence les crawls de Google fait sur leur site. Vous donnant ainsi un user agent toujours à jour : “Mozilla/5.0 (compatible; Googlebot/2.1; +http://www.google.com/bot.html)“.

En général, si l’user agent au complet peu changer, certaines parties de la chaîne restent fixes dans le temps. Un bon moyen d’identifier les différents Googlebots est de vérifier la présence de “Googlebot” dans l’user agent. Exemple en Php :

if (preg_match("/Googlebot/", $_SERVER['HTTP_USER_AGENT'])) {

    echo 'Bonjour Google !';

} else {

    echo 'Toi tu n'es pas Google.';

}

Le gros problème de cette méthode est quelle est très facile à tromper. Un simple plugin Firefox comme User Agent Switcher permettra à n’importe qui de se faire passer pour Google à vos yeux. Bien sûr si vous faite du “whitehat cloaking” cela est sans importance, mais si par hasard vous avez des choses à cacher, vous aller au devant d’un spam report de la part de vos concurrents.

Identifier Googlebot grâce à l’IP :
Une méthode plus efficace consiste à identifier Google à partir de son adresse IP. La aussi la Darkseoteam propose une liste constamment mise à jour, mais le mieux consiste à exploiter vos logs apache pour réaliser votre propre liste qui sera alors à comparer avec la variable php $_SERVER['REMOTE_ADDR'] lors de l’identification.

Le problème ici, est que vous ne serez jamais sur de pas laisser parfois quelques Googlebots passer à travers les mailles de votre filet. Un moyen efficace est de faire un reverse DNS, c’est-à-dire transformer l’adresse IP de vos visiteurs en nom de domaine. Vous devriez alors voir apparaître “googlebot.com“.

> host 66.249.66.1
1.66.249.66.in-addr.arpa domain name pointer
crawl-66-249-66-1.googlebot.com.

Il y a deux façons de mettre cela en place. La première en vérifiant bien que la directive “HostnameLookups” soit à “On” dans votre fichier de config Apache. Le nom de l’hôte sera alors présent dans la variable $_SERVER['REMOTE_HOST']. Le cas échéant, il vous est encore possible de faire un gethostbyaddr sur l’IP du client. Le code :

$hostname = gethostbyaddr($_SERVER['REMOTE_ADDR']);

if (preg_match("/google.com/", $hostname)) {

    echo 'Cloaking sur IP';

} else {

    echo 'Version visiteurs';

}

Si cette dernière méthode est la plus efficace elle n’est certainement pas à conseiller sur des sites à fort trafic, la résolution DNS inverse étant assez lourde.

Il existe d’autres solutions envisageables. On pourrait imaginer par exemple utiliser gethostbyaddr conjointement à une table HEAP contenant les dernières IP ayant demandées une page pour limiter de trop nombreuses résolutions inverses. On doit aussi pouvoir se baser sur le fait que les robots d’indexation ne gèrent pas les cookies et génèrent des sessions à chaque demande de pages. Les solutions finalement ne manquent pas mais sont à moduler en fonction de vos contraintes.

Le cloaking, toujours blackhat ?

Il existe plusieurs applications légitimes du cloaking. Si par exemple vous utilisez des variables de tracking sur votre site, il est plus que conseillé de faire un cloaking sur vos liens internes pour éviter de générer du duplicate content. Des sites réputés comme la Fnac ou Amazon usent de cette technique de façon modéré. Il n’y a qu’à aller sur ces sites avec l’user agent de Google pour voir les différences.

Si votre site nécessite une inscription pour accéder à son contenu, vous pouvez très bien envisager de mettre en place un cloaking pour permettre quand même à Google de l’indexer. On se rapproche ici d’une pratique assez borderline, mais c’est ce qu’ils conseillent eux même pour Google actualités.

Le plus dur étant en général, comme toujours avec Google, de savoir ou se situe la ligne.

Duplicate Content - Présentation

décembre 22, 2008 par Julien  
Catégorie Référencement

Présentation

Dans le but de ne pas présenter des résultats identiques dans les SERPs, Google a depuis longtemps mis en place des filtres pour lutter contre ce qui est généralement appelé le duplicate content. Longtemps, et encore aujourd’hui, et bien que Google se soit souvent exprimé à ce sujet, le duplicate content reste perçu par beaucoup comme une pénalité, alors que ce n’est bien évidement pas le cas.



Deux types de duplicate content

Il n’existe pas un, mais deux types de duplicate content. Le premier concerne les pages identiques qui différent seulement de leur url. Dans ce cas, comme Google l’explique très bien, ils considèrent les pages dupliquées comme une seule page à laquelle ils attribuent l’url de celle qui leur parait la plus représentative. Cette dernière bénéficiera également d’un report vers elle des propriétés des autres urls comme le PageRank. (C’est exactement comme si tous les différents liens n’étaient qu’un seul et même lien pointant vers celle qui pour Google fait office de référence). Le second type de duplicate concerne les copies partielles de contenu. C’est un filtre qui est activé en aval juste avant l’affichage des résultats et qui en cas de copies détectés vous affichera en bas de page “relancer la recherche en incluant les pages ignorées”. Entrons un peu maintenant dans les détails.


Le premier filtre anti duplicate content

Agissant en amont, durant la phase d’indexation, l’application de ce filtre est souvent causé par la présence de plusieurs urls menant vers le même contenu. Les exemples sont nombreux :


- Site accessible avec et sans “www“.
- Site renvoyant la même page avec ou sans “index.html” à la fin.
- Appeler une même page avec deux noms différents.

Les solutions : les corrections à apporter sont différentes selon chaque cas. Pour le premier problème, la solution la plus simple est de renseigner l’url principale de GWT (Google Webmaster Tools). Pour le second on utilisera en général des 301. Enfin dans le dernier cas, on veillera surtout a avoir une structure de liens homogène sur l’ensemble de site. Souvent Google s’en sortira très bien tout seul.


Le second filtre anti duplicate content

Google veille à bien afficher des résultats différents dans ses SERPs. Si deux pages portant le même texte devaient remonter sur une recherche, Google n’en affichera qu’une seule tout en vous présentant à la fin la possibilité de relancer votre recherche en affichant le contenu ignoré. Ce filtre est d’autant plus efficace pour des titres et metas identiques.

Le choix du résultat à afficher est aux dernière nouvelles basé sur le PageRank bien que Google parle parfois de l’historique d’indexation. Dans les faits cette prédominance du PageRank dans ce choix entraine souvent la dépréciation par Google de contenu originaux aux profits de sites mieux implantés. C’est un point qui dans l’avenir pourrait changer.

Un moyen bien connu des référenceurs blackhat pour échapper a ce filtre est de suffisament modifier leur texte pour que la correspondance entre l’original et la copie ne puisse pas être établie. Ce n’est pas vraiment le sujet de cet article mais le filtre anti duplicate de Google est relativement peu efficace (même quand il s’agit de textes identiques non retouchés).


Devez-vous toujours avoir peur du duplicate content ?

Oui et non. Non, car au risque de me répéter le duplicate content n’est pas une pénalité. Dans la majorité des cas Google s’en accommode très bien sans que cela vous soit préjudiciable. Oui, car le filtre est imparfait et qu’il privilégiera les gros sites au détriment du votre. Qui plus est si vous avez une quantité trop importante de duplicate cela peut avoir des effets indirects négatifs, comme par exemple sur l’indexation de votre site. Enfin nous ne parlons ici que de duplicate involontaire. Si votre site est basé sur la copie de contenu vous risquez à moyen terme les foudres de Google pour non respect de ses guidelines.



Références

[ 1 ] - Demystifying the duplicate content penalty - fr.
[ 2 ] - Une excellente analyse du site Rankspirit.
[ 3 ] - Compléments d’information du centre d’aide aux webmasters.

Google Friend Connect devient public

décembre 8, 2008 par Julien  
Catégorie Réseaux sociaux

La réponse de Google à Facebook ne s’est pas faite attendre. Hasard du calendrier ou non, Google vient enfin de rendre public son Google Friend Connect.

Si le but recherché par ces deux services (Facebook Connect et Friend Connect) est assez similaire, l’approche elle est totalement différente. Les widgets proposés par Google me semblent très simples à intégrer mais assez restrictifs, à l’inverse les API d’Opensocial et Facebook Connect sont plus complexes.

Voici deux widget Friend Connect pour vous faire une idée. Le premier pour s’inscrire sur presse agrume et le second pour ajouter des commentaires. On regrettera que pour le moment les widgets ne soient pas traduis.

Google fait renaitre life

décembre 1, 2008 par Julien  
Catégorie Tribune libre

Un an après la disparition de LIFE, le mythique magazine américain, Google met en ligne l’ensemble de ses archives photos.

Plus de cent ans d’histoire à revivre en image :
http://images.google.com/hosted/life

Google n’a pas dit Yahoo

novembre 8, 2008 par Julien  
Catégorie Entreprises

L’accord entre les deux géants du web n’aura finalement jamais lieu. Lassé des problèmes avec le département de la justice, Google a finalement décidé de ce retirer au grand dam de Yahoo.

Avec une action qui ne pèse plus maintenant que 15$, Yahoo se dit déçu de cette décision, et Jerry Yang à ouvertement déclaré qu’il était prêt à reprendre les discussions avec Microsoft.

Le code d’android est disponible

octobre 25, 2008 par Julien  
Catégorie Nouveautés

Android, la plateforme Google pour applications mobile est libre. Google vient de rendre son projet open source en plaçant le code sous licence Apache.

Vous trouverez toutes les infos ici :
http://source.android.com

L’annonce a été faite le 21 Octobre, soit la veille du lancement du G1 d’HTC, plus souvent appelé le Google Phone, ou GPhone, premier mobile à embarquer la plateforme Android.

La date de sortie du Gphone en France n’est pas connue à l’heure actuelle.

Je le trouve plus beau en blanc.

Le nouveau Google Analytics

octobre 25, 2008 par Julien  
Catégorie Analytique

Si vous aimiez Google Analytics, vous devriez l’aimer encore plus. Si vous ne l’aimiez pas, vous devriez quand même l’adorer. Google vient en effet de présenter à Washington la dernière version de son outil d’analytique, et les améliorations apportés devraient ravir les plus exigeant d’entre vous.

Au programme :

De vrais possibilités de segmentation : si la segmentation des informations trafic était une des faiblesses de l’outil, la version trois corrige amplement le tir. Le croisement des données pour des statistiques toujours plus fine devient enfin possible, et facile comme un jeu d’enfant.

l’API Google analytics est la. Enfin ! Si vous trouvez que des fonctionnalités manquent, vous n’aurez plus qu’à rapatrier les données qui vous intéressent en trois ligne de code et les traiter vous même.

Voici les deux améliorations qui m’importaient le plus, mais c’est sans compter la génération de rapports sur mesure, les graphiques animées, ou l’intégration d’Adsense qui rendent l’outil plus encore qu’avant : incontournable. Si Google Analytics avait peu à envier à ses concurrents payants, cette nouvelle monture constitue une fois de plus un grand pas en avant.

Page suivante »