Le G2 d’HTC - Sous Google android
Enfin un iPhone killer ! Un vrai. Oubliez le Blackberry Storm, le HTC Touch HD, ou le Nokia 5800. La future merveille de chez HTC, le G2 est bientôt la.
Tout les caractéristiques sont la pour en faire un bête de concours. Androïd de Google bien sur, un écran de 3,2 pouces, un appareil photo 5 Mégapixels avec flash et autofocus, un capteur en facade pour la visio, le WIFI, Bluetooth, EDGE, et surtout un design de toute beauté qui dépasse largement celui du premier GPhone du même HTC.
Bref, le G2 motorisé par Androïd est une merveille qui devrait sortir aux US courant Janvier. Vivement qu’il arrive en France.
Quelques shoots pour le plaisir des yeux


Le cloaking, inutile ?
décembre 29, 2008 par Julien
Catégorie Référencement
Présentation
“La technique du Cloaking (en français dissimulation) est une technique utilisée par les black hat pour optimiser leur positionnement dans les moteurs de recherche. [...] Le seul usage légitime qu’il peut être fait de cette technique est de proposer seulement aux clients qui peuvent l’interpréter des contenus spécifiques (par exemple, un contenu Adobe Flash n’est pas lisible par un robot). Aujourd’hui, de meilleures méthodes d’accessibilité sont à disposition, rendant le cloaking inutile.” Source : Wikipedia.
Le cloaking est une technique légitime de référencement consistant à proposer deux versions d’une même page selon que le visiteur soit un robot ou un humain. Si le cloaking à mauvaise presse il n’en est pas moins vrai que de nombreux sites très connus et bien classés dans Google l’utilisent à bon escient.
Mais d’abord techniquement, le cloaking, comment ça marche ?
Le premier problème qui se pose lorsqu’on veut réaliser un bon cloaking est de réussir à bien identifier Googlebot (Et les autres robots). Il existe plusieurs méthodes avec chacune avantages et inconvénients.
Identifier Googlebot grâce à l’user-agent :
Lorsqu’une application se connecte à un serveur web, elle envoi généralement dans sa requête HTTP un entête “user agent” contenant une chaîne de caractères permettant de l’identifier. Il suffit donc pour détecter Googlebot d’examiner l’user agent.
La darkseoteam analyse en permanence les crawls de Google fait sur leur site. Vous donnant ainsi un user agent toujours à jour : “Mozilla/5.0 (compatible; Googlebot/2.1; +http://www.google.com/bot.html)“.
En général, si l’user agent au complet peu changer, certaines parties de la chaîne restent fixes dans le temps. Un bon moyen d’identifier les différents Googlebots est de vérifier la présence de “Googlebot” dans l’user agent. Exemple en Php :
if (preg_match("/Googlebot/", $_SERVER['HTTP_USER_AGENT'])) {
echo 'Bonjour Google !';
} else {
echo 'Toi tu n'es pas Google.';
}
Le gros problème de cette méthode est quelle est très facile à tromper. Un simple plugin Firefox comme User Agent Switcher permettra à n’importe qui de se faire passer pour Google à vos yeux. Bien sûr si vous faite du “whitehat cloaking” cela est sans importance, mais si par hasard vous avez des choses à cacher, vous aller au devant d’un spam report de la part de vos concurrents.
Identifier Googlebot grâce à l’IP :
Une méthode plus efficace consiste à identifier Google à partir de son adresse IP. La aussi la Darkseoteam propose une liste constamment mise à jour, mais le mieux consiste à exploiter vos logs apache pour réaliser votre propre liste qui sera alors à comparer avec la variable php $_SERVER['REMOTE_ADDR'] lors de l’identification.
Le problème ici, est que vous ne serez jamais sur de pas laisser parfois quelques Googlebots passer à travers les mailles de votre filet. Un moyen efficace est de faire un reverse DNS, c’est-à-dire transformer l’adresse IP de vos visiteurs en nom de domaine. Vous devriez alors voir apparaître “googlebot.com“.
> host 66.249.66.1
1.66.249.66.in-addr.arpa domain name pointer
crawl-66-249-66-1.googlebot.com.
Il y a deux façons de mettre cela en place. La première en vérifiant bien que la directive “HostnameLookups” soit à “On” dans votre fichier de config Apache. Le nom de l’hôte sera alors présent dans la variable $_SERVER['REMOTE_HOST']. Le cas échéant, il vous est encore possible de faire un gethostbyaddr sur l’IP du client. Le code :
$hostname = gethostbyaddr($_SERVER['REMOTE_ADDR']);
if (preg_match("/google.com/", $hostname)) {
echo 'Cloaking sur IP';
} else {
echo 'Version visiteurs';
}
Si cette dernière méthode est la plus efficace elle n’est certainement pas à conseiller sur des sites à fort trafic, la résolution DNS inverse étant assez lourde.
Il existe d’autres solutions envisageables. On pourrait imaginer par exemple utiliser gethostbyaddr conjointement à une table HEAP contenant les dernières IP ayant demandées une page pour limiter de trop nombreuses résolutions inverses. On doit aussi pouvoir se baser sur le fait que les robots d’indexation ne gèrent pas les cookies et génèrent des sessions à chaque demande de pages. Les solutions finalement ne manquent pas mais sont à moduler en fonction de vos contraintes.
Le cloaking, toujours blackhat ?
Il existe plusieurs applications légitimes du cloaking. Si par exemple vous utilisez des variables de tracking sur votre site, il est plus que conseillé de faire un cloaking sur vos liens internes pour éviter de générer du duplicate content. Des sites réputés comme la Fnac ou Amazon usent de cette technique de façon modéré. Il n’y a qu’à aller sur ces sites avec l’user agent de Google pour voir les différences.
Si votre site nécessite une inscription pour accéder à son contenu, vous pouvez très bien envisager de mettre en place un cloaking pour permettre quand même à Google de l’indexer. On se rapproche ici d’une pratique assez borderline, mais c’est ce qu’ils conseillent eux même pour Google actualités.
Le plus dur étant en général, comme toujours avec Google, de savoir ou se situe la ligne.
Duplicate Content - Présentation
décembre 22, 2008 par Julien
Catégorie Référencement
Présentation
Dans le but de ne pas présenter des résultats identiques dans les SERPs, Google a depuis longtemps mis en place des filtres pour lutter contre ce qui est généralement appelé le duplicate content. Longtemps, et encore aujourd’hui, et bien que Google se soit souvent exprimé à ce sujet, le duplicate content reste perçu par beaucoup comme une pénalité, alors que ce n’est bien évidement pas le cas.
Deux types de duplicate content
Il n’existe pas un, mais deux types de duplicate content. Le premier concerne les pages identiques qui différent seulement de leur url. Dans ce cas, comme Google l’explique très bien, ils considèrent les pages dupliquées comme une seule page à laquelle ils attribuent l’url de celle qui leur parait la plus représentative. Cette dernière bénéficiera également d’un report vers elle des propriétés des autres urls comme le PageRank. (C’est exactement comme si tous les différents liens n’étaient qu’un seul et même lien pointant vers celle qui pour Google fait office de référence). Le second type de duplicate concerne les copies partielles de contenu. C’est un filtre qui est activé en aval juste avant l’affichage des résultats et qui en cas de copies détectés vous affichera en bas de page “relancer la recherche en incluant les pages ignorées”. Entrons un peu maintenant dans les détails.
Le premier filtre anti duplicate content
Agissant en amont, durant la phase d’indexation, l’application de ce filtre est souvent causé par la présence de plusieurs urls menant vers le même contenu. Les exemples sont nombreux :
- Site accessible avec et sans “www“.
- Site renvoyant la même page avec ou sans “index.html” à la fin.
- Appeler une même page avec deux noms différents.
Les solutions : les corrections à apporter sont différentes selon chaque cas. Pour le premier problème, la solution la plus simple est de renseigner l’url principale de GWT (Google Webmaster Tools). Pour le second on utilisera en général des 301. Enfin dans le dernier cas, on veillera surtout a avoir une structure de liens homogène sur l’ensemble de site. Souvent Google s’en sortira très bien tout seul.
Le second filtre anti duplicate content
Google veille à bien afficher des résultats différents dans ses SERPs. Si deux pages portant le même texte devaient remonter sur une recherche, Google n’en affichera qu’une seule tout en vous présentant à la fin la possibilité de relancer votre recherche en affichant le contenu ignoré. Ce filtre est d’autant plus efficace pour des titres et metas identiques.
Le choix du résultat à afficher est aux dernière nouvelles basé sur le PageRank bien que Google parle parfois de l’historique d’indexation. Dans les faits cette prédominance du PageRank dans ce choix entraine souvent la dépréciation par Google de contenu originaux aux profits de sites mieux implantés. C’est un point qui dans l’avenir pourrait changer.
Un moyen bien connu des référenceurs blackhat pour échapper a ce filtre est de suffisament modifier leur texte pour que la correspondance entre l’original et la copie ne puisse pas être établie. Ce n’est pas vraiment le sujet de cet article mais le filtre anti duplicate de Google est relativement peu efficace (même quand il s’agit de textes identiques non retouchés).
Devez-vous toujours avoir peur du duplicate content ?
Oui et non. Non, car au risque de me répéter le duplicate content n’est pas une pénalité. Dans la majorité des cas Google s’en accommode très bien sans que cela vous soit préjudiciable. Oui, car le filtre est imparfait et qu’il privilégiera les gros sites au détriment du votre. Qui plus est si vous avez une quantité trop importante de duplicate cela peut avoir des effets indirects négatifs, comme par exemple sur l’indexation de votre site. Enfin nous ne parlons ici que de duplicate involontaire. Si votre site est basé sur la copie de contenu vous risquez à moyen terme les foudres de Google pour non respect de ses guidelines.
Références
[ 1 ] - Demystifying the duplicate content penalty - fr.
[ 2 ] - Une excellente analyse du site Rankspirit.
[ 3 ] - Compléments d’information du centre d’aide aux webmasters.
Nuage de tags et référencement
décembre 16, 2008 par Julien
Catégorie Référencement
Suivant presque aveuglément les recommandations de Google (vos pages ne doivent pas ressembler à des pages de résultat, évitez le duplicate content), beaucoup de référenceurs suggèrent de ne pas les utiliser, ou à défaut, de les mettre en nofollows avec du disallow sur les pages pointées. Mais ces pages sont-elles tellement nuisible à votre référencement ?

Principalement deux problèmes sont souvent évoqués :
- Les pages pointées par des tags s’apparentent trop à des résultats de recherche.
- Elles sont génératrice de duplicate content.
Déjà, d’une part, c’est rarement les deux à la fois, sauf erreur de conception flagrante (tag = catégorie), dans le cas de wordpress par exemple soit vous faites un usage pertinent de la balise more, et le risque de duplicate sera très faible, mais les pages ressembleront à des pages de résultats, soit vous n’en usez pas et vous générerez du duplicate, avec des pages souvent moins optimisées pour les tags en question.
Mais de toute façon, j’ai envie de dire : et alors ?
Pour les pages type “résultats”
Concernant ces pages, qui sont par exemple légions sur les sites de E-commerce, les voyagistes en ligne ou les comparateurs de prix (et qui remontent très bien), cela fait longtemps qu’on sait ce que Google en pense. Ils ont déjà par le passé tentés de leur donner une importance moindre dans les résultats de recherche (Avec comme double effet kiss cool un avantage presque évident pour les liens sponsorisés de la page). Le résultat fut sans appel. Une expérience utilisateur moindre et un taux d’abandon plus important. Les visiteurs ne cliquaient pas plus sur les liens payant mais allaient juste voir ailleurs ou plus bas dans les résultats. Et il n’y a rien d’étonnant à cela. Si vous tapiez “voyage marrakech” et que Google vous proposait de suite la meilleure offre possible, ne voudriez vous pas tout de même consulter les offres concurrentes ? Sauf abus non équivoque, style annuaires fourre tout, ou site d’agrégation, vos pages type “résultats” passeront encore de beaux jours dans les SERPs.
Pour le duplicate content
Les problèmes de DC, notamment liés aux tags, font parties de ces innombrables mythes et légendes qui peuplent l’univers imaginaire des référenceurs. Heureusement Google à récemment fait un point la dessus, que certains n’ont probablement pas lu, ou du moins pas encore intégrés. La aussi, sauf abus non équivoque il n’existe pas de pénalités dues au duplicate content. Seulement quelques effets indirects plus ou moins observables, qui peuvent être préjudiciables quelquefois, mais qui sont insignifiant dans la grande majorité des cas.
Aussi les critiques faites sur l’intérêt SEO d’un nuage de tags sont pour la plupart infondées. Il n’empêche qu’un trop grand nombre de tags, ou un nuage mal construit, ne sont pas une bonne chose. D’ou la réponse que je vais tenter d’apporter à cette seconde question : Qu’est-ce qu’un bon nuage de tag ?
Nuages de tags et référencement ne sont pas directement liés. Un nuage de tags n’est qu’une mise en forme particuliaire de liens, et afficher des liens déjà existant sous la forme d’un nuage de tags ne changera rien en terme de référencement. Pour autant, le suivi des quelques conseils qui vont suivre peut s’avérer pertinent.
N’ayez pas trop de tags dans vos nuages
Il est souhaitable de ne jamais avoir trop de liens sur ses pages. Aussi, évitez les nuages de tags à rallonge avec 200 mots clés. Un nuage avec entre 30 et 50 mots clés est préférable, bien que cela dépende de nombreux paramètres et de la structure de votre site, mais c’est le choix à faire dans le cadre général. Par exemple, si vous utiliser un blog sous Wordpress. Un nuage de tag trop important va créer un réseau trop dense de liens, au détriment de vos posts.
Structurez vos tags
Il est bon de définir à l’avance les tags que vous aller utiliser (une trentaine), tout en vous laissant l’option d’en rajouter ensuite en fonction des besoins. Il existe, la aussi pour Wordpress, d’excellent plugins de gestion de tags. Cumuler des tags singulier / pluriel, c’est avoir plusieurs pages en concurrence pour les mêmes mots, et générer inutilement du duplicate. Pour finir, vos tags ne doivent pas avoir le même nom que vos catégories. Ils servent entre autre à étendre votre nombre de mots clés, et à réaliser des liens transversaux entre vos catégories. Vous pouvez par exemple envisager un nuage de tags “marques” pour un site de vente en ligne, ou “top recherches” pour un site d’informations…
Économisez vos liens, et multipliez vos nuages
Si vous avez par exemple une page lié au tag d’un nuage qui remonte en première position, ajouter une nouvelle page avec le nuage et le tag est contre productif. C’est un lien gaché qui ne vous apportera pas plus de visibilité que s’il n’existait pas. Pour cette raison, et d’autres, il n’est pas souvent souhaitable que votre nuage soit présent sur toutes vos pages. La home, et le haut de la navigation, suffisent en général amplement.
Pour augmenter l’étendue de vos mots clés, vous pouvez envisager de créer des sous nuages. Idéalement dans cette optique, le haut de la navigation, et les pages pointées par les tags porteront le même nuage principal, par contre les pages liées par les pages pointées par les tags contiendront elles un sous nuages, le plus souvent en relation avec leur nuage parent. Idéalement, afin de réaliser des optimisations ponctuelles du linking, on envisagera la possibilité de liens transversaux entre les nuages.
Utilisez le balisage sémantique
Généralement, les nuages de tags utilisent des styles pour leur mise en forme. Mais rien ne vous empêche de les optimiser en mettant en emphase le contenu. Du “strong” pour les plus important, ou mieux quand ils sont en rapport avec la page que l’utilisateur visite, et des “em” pour les nouveaux liens par exemple, afin de les faire ressortir et leur apporter plus de trafic.
Pour conclure, rapellez vous l’essentiel. Les nuages de tags ne sont que des liens. La question que vous devez vous poser n’est pas : “Puis-je réaliser un nuage de tag pour améliorer mon référencement ?” Mais il peut par contre arriver que la solution “nuage de tags” réponde à des questions comme : “Comment intégrer cette structure de liens de façon agréable ?”, “Comment optimiser le positionnement de ce top recherches ?”, “Comment étendre facilement le champ de mes mots clés ?”, “Comment créer une sous structure de pages qui puissent dynamiser le positionnement de pages déjà existantes ?”… Quelquefois le nuage sera une bonne réponse, quelquefois non. Mais n’oubliez jamais d’accorder beaucoup d’importance à la structure des liens, et à celle des landing pages de ces tags. Les nuages de tags ne sont pas préjudiciables en eux même, par contre, mal pensés, mal construit, ils ne sont pas toujours souhaitables.
Google Friend Connect devient public
décembre 8, 2008 par Julien
Catégorie Réseaux sociaux
La réponse de Google à Facebook ne s’est pas faite attendre. Hasard du calendrier ou non, Google vient enfin de rendre public son Google Friend Connect.
Si le but recherché par ces deux services (Facebook Connect et Friend Connect) est assez similaire, l’approche elle est totalement différente. Les widgets proposés par Google me semblent très simples à intégrer mais assez restrictifs, à l’inverse les API d’Opensocial et Facebook Connect sont plus complexes.
Voici deux widget Friend Connect pour vous faire une idée. Le premier pour s’inscrire sur presse agrume et le second pour ajouter des commentaires. On regrettera que pour le moment les widgets ne soient pas traduis.
Lancement de Facebook Connect
décembre 8, 2008 par Julien
Catégorie Réseaux sociaux

Dans la guerre sans merci qui oppose Facebook au reste du monde (OpenId, Opensocial… et tout les sites liés), la célèbre firme de Palo Alto vient enfin de rendre disponible son tant attendu Facebook Connect.
Sur le principe, cela permet aux site de votre choix qui le proposent d’accéder à certaines informations de votre réseau social, et de publier dans votre flux d’activités. CBS, CNN, Hulu, Twitter, digg et de nombreux autres sites sont ou vont très prochainement devenir compatible avec Facebook Connect.
En plus de cela, Facebook ne chôme pas. Une nouvelle marketplace va voir très prochainement le jour, et de nouvelles possibilités en matière de vidéo viennent d’apparaître comme la HD et la possibilité d’exporter ses vidéos à l’extérieur de la plateforme (comme le permettent par exemple Youtube ou Dailymotion).
Plus belle la vie - Mon cul !
décembre 1, 2008 par Julien
Catégorie Tribune libre
Petit billet en forme de coup de gueule, pour dénoncer les amendements récents de la réforme de l’audiovisuel qui visent à augmenter hypocritement la redevance télé en en élargissant l’assiette à des personnes qui ne devraient pas être concernées.
Sous peu, si l’amendement passe, toute personne possédant un ordinateur susceptible de recevoir la télévision, devra s’acquitter de cette taxe. Que vous la regardiez ou non.
Le député Jean Dionis du Séjour, le brillant esprit à l’origine de cette loi, voudrait également que les téléphones portables y soient assujettis. Il voudrait également instaurer une taxe payable par tout revendeur de téléviseurs, ordinateurs, ou téléphones portables pouvant recevoir la télévision, à hauteur de 0,9% du chiffre d’affaire.
Si encore cet argent était utilisé pour aider des personnes ou des sociétés qui en ont réellement besoin en cette période de crise… Réjouissons nous il participera à financer ces programmes merveilleux que sont “plus belle la vie”, “trente millions d’amis”, et “la carte au trésor”.
Google fait renaitre life
décembre 1, 2008 par Julien
Catégorie Tribune libre
Un an après la disparition de LIFE, le mythique magazine américain, Google met en ligne l’ensemble de ses archives photos.
Plus de cent ans d’histoire à revivre en image :
http://images.google.com/hosted/life