Développeur Drupal – Blog d'un passionné, un peu touche à tout, dans le monde du web.
Ce que nous venons de faire était simple mais pourtant ces actions étaient essentielles. Maintenant nous allons aller un petit peu plus loin et passer à des choses plus marrantes.
La création d’un site map ou en français d’un plan de site va permettre d’indiquer facilement aux moteurs de recherche le contenu qu’il leur est possible d’explorer sur notre site.
Un Site map est une cartographie d’adresses des différents contenus qui composent votre site Internet auxquels on ajoute des informations, de précieuses méta-données.
Pour réaliser un site map facilement vous pouvez utiliser les modules Site map ou XML site map qui ont été conçu pour répondre aux spécifications de sitemaps.org.
Mettre en place un sitemap sur votre site.
Modules requis : site map ou xml site map
Lorsqu’un moteur de recherche analyse votre site web on dit que celui-ci indexe votre contenu, ce robot d’indexation est appelé Crawler (« Butineurs »). Il fonctionne comme un internaute, il navigue de lien en lien, analyse le contenu et indexe les mots clés qu’il rencontre dans le but de capitaliser le plus de page web possible.
Afin de préciser au Crawler ce qu’il doit ou ce qu’il n’a pas le droit d’indexer on utilise un fichier nommé Robot.txt contenant des règles d’autorisation ou d’exclusion. Ce fichier est la première chose lue par le moteur d’indexation lors de son passage sur votre site. Si toutefois vous n’aviez pas de fichier Robots.txt sur votre site, le Crawler considèrera qu’il peut analyser tout le contenu de votre site.
Notez que dans l’archive de Drupal que vous avez téléchargée, il y a déja un fichier Robots.txt
Pour plus de renseignements sur la configuration du fichier je vous renvoie sur wikipédia et sur annuaire-info pour quelques exemples.
Avec Drupal il y a un module pour presque tout, alors il existe un module pour gérer le fichier robots.txt depuis l’interface d’administration, mais notez que ce module est surtout utile dans le cas de gestion de multi-site ou vous auriez un fichier par site.
Dans la premiere partie de cet article nous avons mis en place les « belles urls » afin d’avoir des urls de type http://monsite.fr/drupal-référencement. A ce stade nous nous retrouvons avec un problème de duplication de contenu. En effet Drupal ne desactive pas l’ancienne adresse et le contenu devient accessible par deux adresses.
Cet action est dangeureuse, Google n’aime pas ça et il assigne cela à de la multiplication artificielle de contenu qu’il punit en inscrivant votre site à sa liste noire.
Pour éliminer ce problème nous allons utiliser le module global redirect qui, au moment de l’accès à une page, interrompera le chargement de celle-ci et redirigera vers l’alias de la page.
L’administration du module se fait depuis la page [ Admin › configuration du site › globalredirect ] mais la configuration par défaut est parfaite.
Modules requis : global redirect
Le nom de ce module parle de lui même. Path redirect permet de rediriger des urls vers un autre chemin interne ou externe. Ce qui est pratique lorsque votre contenu a bougé ou que vous souhaitez détourner le trafic vers une autre page.
Pour créer une redirection c’est très simple, il vous suffit de vous rendre sur la page dédiée : [ Admin › construction du site › urls redirigées ] d’insérer l’ancienne adresse, la nouvelle adresse et les variables à passer avec l’url.
Vous pouvez depuis le menu ‘Paramètres’ choisir d’informer l’internaute qu’il subit une redirection vers une autre page.
Modules requis : Path redirect
Lorsque vous essayez d’accéder à un contenu inexistant ou que l’adresse url à changé Drupal vous affiche une page d’erreur, c’est la fameuse page 404.
Le module seach 404 va nous permettre d’aller plus loin dans l’aide aux internautes puisqu’il permet lorsqu’une page est introuvable d’exécuter une recherche en fonction de la demande initiale.
Prenez par exemple la page http://monsite.fr/does/not/exist, search 404 va effectuer une recherche sur la phrase « does not exist ».
L’administration du module [ Admin › configuration du site › Search 404 settings ] permet de modifier le comportement du module lorsqu’il trouve une réponse pour rediriger l’internaute. Vous pouvez ainsi choisir de forcer l’utilisateur à être redirigé vers la première réponse. Je déconseille fortement d’activer cette option, car vos utilisateurs risquent de ne pas comprendre comment et pourquoi ils sont arrivés à cet endroit.
Modules requis : Search 404
Vous êtes maintenant bien préparé pour mener votre combat au référencement. Mais installer des modules n’est pas suffisant, il faut aussi surveiller et optimiser ce qui à été fait. Pour cela rendez-vous dans la troisième partie ou nous aborderons ce sujet qui vous donnera quelques pistes à étudier.
Bienvenue sur mon blog. Sur cet espace j’essaie de partager au mieux ma passion pour le web et actuellement mon engouement pour Drupal. Vous trouverez ici mes découvertes, mes problématiques et les solutions rencontrées.
8 Responses to Partie II – Plus loin dans le référencement
Référencement de votre site Drupal, titre, mots-clés, | Julien dubreuil
mars 12th, 2010 at 14 h 40 min
[...] Partie II – Plus loin dans le référencement Tags: Documentations, Drupal, Réferencement [...]
Pierre
mars 14th, 2010 at 14 h 37 min
Très intéressant mais j’aimerais apporter un point :
même s’il vaut mieux ne pas en avoir, google ne penalise pas le contenu dupliqué :
voir sur le site officiel de google :
http://googlewebmastercentral.blogspot.com/2008/09/demystifying-duplicate-content-penalty.html
ou une traduction libre :
http://www.goopilation.com/2008/09/webmaster-demystification-du-duplicate.html
Julien
mars 14th, 2010 at 21 h 49 min
Bonjour Pierre
Effectivement Google ne pénaliserait plus le contenu dupliqué, mais cela n’était pas le cas à l’époque ou j’ai écrit cet article.
Cette deuxième partie sur le référencement est restée un paquet de semaines dans les tiroirs parce qu’elle ne me semblait pas assez terminée. Et je me suis dit qu’il était quand même dommage après le temps passé dessus qu’il ne serve jamais à personne.
On peut quand même se poser la question. Et les autres, autorisent-ils ou non la duplication de contenu ?
antoine koudaya
avril 7th, 2010 at 12 h 30 min
Merci beaucoup julien pour ce tuto que je trouve très intéressant pour nous les débutants.
En effet, je suis un nouveau dans le monde drupal et je veux pouvoir faire des trucs très fantastiques avec ( même si je n’y suis pas encore vraiment).
Bon, au vif du sujet maintenant! En fait, j’utilise d6 et je m’apprête à mettre en ligne mon premier site pro dans quelques jours, ce qui m’a amené sur votre blog. Ce qui m’embarasse un peu, c’est que moi je ne veux pas que la case à cocher « automatic alias » s’affiche sur mes pages de création de nouveau contenus. Alors que me conseillez vous pour y arriver?
Merci d’avance pour avoir accepté perdre de votre précieux temps en vue de me répondre.
Bonne journée et j’espère pouvoir lire votre conseil dans la journée.
Merci encore!
Julien
avril 7th, 2010 at 19 h 52 min
Bonjour Antoire.
Si vous voyez cette case c’est parce que vous avez les droits d’administration (enfin je pense) sur le module pathauto.
Si vous voulez l’enlever pour les autres utilisateurs il suffit de créer un rôle avec moins de droits, si c’est uniquement pour vous il faudrait peut être regarder du côté des modules permettant de modifier l’interface d’édition d’un node (ex : nodeformsettings).
En espérant avoir pu vous aider.
antoine
avril 12th, 2010 at 14 h 48 min
merci julien
Mais quel droit puis je manipuler pour l’enlever sur les formulaires à remplir par les visiteurs?
Merci
antoine
avril 13th, 2010 at 17 h 54 min
merci mon frère
opi
septembre 20th, 2010 at 13 h 32 min
Salut Julien,
Je suis tombé sur un article de Volacci sur le robot.txt de drupal, et j’ai repensé a ton article. Voila donc un article en anglais avec un robots.txt bien plus fourni que celui d’origine.
http://www.volacci.com/blog/ben-finklea/2010/september/17/how-fix-problems-drupal%E2%80%99s-default-robotstxt-file
opi