Blog SEO & Ruby

  • Sémantique

    Clustering de mots-clés : un exemple avec K-means & Ruby

    2 Jun 2016

    Le machine learning étant un des nouveaux sujets SEO du moment, j'ai récemment commencé à approfondir le sujet et à mettre les mains dans le cambouis, dans le cadre d'une problématique bien précise : la catégorisation de mots-clés.

  • Outils SEO

    Analyser les données Search Console avec Google Sheets & Blockspring

    29 Mar 2016

    Google Sheets est un excellent outil que j'utilise beaucoup dans mon activité SEO : pour générer des reporting avec l'API analytics, pour trier des mots-clés, ou même pour extraire les résultats Google sur une requête (même s'il semblerait que cela ne fonctionne plus depuis quelques semaines). Couplé à l'add-on Blockspring, les possibilités sont multiples.

  • Sémantique

    Les pièges à éviter lors de l'analyse sémantique

    7 Mar 2016

    Le 4 février dernier avait lieu à l'Espace Inkermann une nouvelle édition du SEO Campus Lille. Au programme : un peu de R, de webspam ou encore d'Adwords mais aussi et surtout des échanges très intéressants avec les participants. Pour ma part, j'ai eu le plaisir d'y intervenir pour une conférence sur les pièges à éviter lors de l'analyse sémantique.

  • Outils SEO

    Installer Serposcope sur un Raspberry Pi 2

    8 Jan 2016

    Ayant récemment fait l'acquisition d'un Raspberry Pi 2, je commence petit à petit à en découvrir tout le potentiel, notamment en termes d'automatisation. S'agissant d'une machine tournant sous un OS dérivé de Debian, Raspbian, elle permet de faire tout un tas de choses amusantes, comme par exemple du suivi de positionnement avec Serposcope, un outil open source développé par Serphacker (au passage, merci à lui !). Je vous explique ici comment l'installer sur votre machine...

  • SEO On-site

    Bonnes pratiques SEO sous Ruby on Rails - 2ème partie

    17 Nov 2015

    Dans le 1er article sur les bonnes pratiques SEO sous Ruby on Rails, nous avons vu comment avoir des URL propres, optimiser ses balises title & meta et éditer facilement son fichier robots.txt. Voyons aujourd'hui comment forcer un domaine canonique (www), construire un fichier sitemap.xml, définir une page d'erreur 404 personnalisée et utiliser le cache HTTP.

  • Sémantique

    Calcul de similarité avec Ruby

    11 Oct 2015

    Les solutions logicielles ou saas permettant de détecter le contenu dupliqué sur un site web sont, soit un peu trop opaques, soit un peu trop onéreuses à mon goût. Je vous présente donc ici un script rudimentaire, permettant à la fois, de crawler un site web en aspirant son contenu page à page, et de calculer la similarité de chacune des pages entre elles, en utilisant le tf-idf et le cosinus de Salton.

  • SEO On-site

    Désindexer une page CMS sous Magento

    6 Oct 2015

    Cet article tient davantage du mémo que du billet. Il me permettra, ainsi qu'à vous je l'espère, d'avoir sous la main un reminder sur la façon de désindexer une page CMS avec Magento, sans mettre les mains dans le cambouis.

  • SEO On-site

    Bonnes pratiques SEO sous Ruby on Rails - 1ère partie

    27 May 2015

    Après avoir passé quelques années à bidouiller des petits scripts en Ruby, je me suis lancé l’année dernière dans l’apprentissage de Ruby on Rails, grâce notamment à ce livre de Stefan Wintermeyer, que je recommande d’ailleurs vivement à tous ceux qui seraient désireux d’apprendre les bases de RoR. N’étant pas développeur de formation, ce framework est pour moi vraiment intéressant dans le sens où il permet de développer rapidement et sans trop de prise de tête des applications plus ou moins complexes. Ayant suffisamment de recul sur le fonctionnement de Rails, je vous propose une série d’articles sous forme d’astuces pour optimiser les fondamentaux SEO de votre application Ruby on Rails. C’est parti pour la 1ère partie !

  • Sémantique

    Recherches associées Google : décryptage et méthode de scrape

    30 May 2014

    Depuis quelques temps, le blog de Bill Slawski est entré dans mes favoris. En décryptant les différents brevets publiés par Google, cet auteur très réputé aux Etats Unis permet aux référenceurs de mieux comprendre comment fonctionne Google et surtout de découvrir quelles méthodes de traitement automatiquement du langage sont à l'oeuvre du côté de Mountain View. Ses billets sur les recherches associées ou related queries ont particulièrement attiré mon attention. Ce sera donc l'objet de cet article, avec, en bonus, un petit script maison pour scraper les recherches associées avec CasperJS (voir l'article de 512Banque pour une présentation sous l'angle SEO).

  • SEO On-site

    Webmaster Tools : comment Google compte-t-il les liens internes ?

    3 May 2014

    Après avoir essayé de décrypter la façon dont Google comptait les occurences de mots-clés, j'ai cette fois-ci mené l'enquête sur l'onglet Trafic de recherche > Liens internes de Google Webmaster Tools, qui est, de mon point de vue en tout cas, peu utilisé / analysé par les SEO. L'objectif de ce test était de savoir si Google comptabilisait ou non les liens multiples pointant d'une page interne A vers une page interne B (cf First link counts rule)

  • Outils SEO

    Unix : 5 commandes de base utiles pour le SEO

    15 Apr 2014

    Au quotidien, quand on travaille avec un système d'exploitation comme OS X ou Linux, il est pratique de pouvoir lancer certaines commandes dans le shell pour manipuler des fichiers, obtenir des informations sur des pages web, mesurer des temps de réponses, etc. Certaines commandes peuvent avoir un véritable intérêt pour le SEO. J'en donne ici 5 parmi mes favorites.

  • SEO On-site

    Octopress : 10 conseils d'optimisation SEO

    26 Jan 2014

    Si Octopress est incomparable en termes de performances, il présente quelques lacunes quant à l'optimisation pour le référencement. Je vous propose donc dans cet article 10 astuces simples à mettre en place pour rendre le framework plus SEO friendly

  • SEO On-site

    Méfiez-vous des plugins wordpress seo-friendly

    7 Jan 2014

    Wordpress est un CMS très pratique quand il s'agit de monter un petit projet sans devoir trop mettre les mains dans le cambouis. Le gros avantage est en effet de pouvoir utiliser la myriade de plugins disponibles pour greffer différentes fonctionnalités au site, sans même quitter la console d'admin. Pour autant, il convient de rester vigilant lors de l'utilisation d'un plugin. Retour d'expérience.

  • Sémantique

    Mots-clés de contenu Google Webmaster Tools : sur quel contenu porte l'analyse ?

    24 Dec 2013

    Si vous possédez un compte Webmaster Tools et que vous y avez inscrit vos sites, vous avez peut être déjà remarqué l'onglet 'Mots-clés de contenu' dans la section 'Index Google'. La documentation officielle précise qu'il s'agit là d'un échantillon des mots-clés les plus représentatifs trouvés par Google lors de l'exploration du site. Mais savez-vous comment Google s'y prend pour calculer le nombre d'occurences ? Je vous donne ici ma vision des faits. Il ne s'agit que d'une interprétation personnelle, je ne prétends pas vous donner une vérité, d'ailleurs vous le verrez, j'arrive difficilement à une conclusion solide

  • Scripts SEO

    Créer une tâche cron SEO avec Whenever, Mail et Amazon EC2

    12 Nov 2013

    Quand on bosse le SEO d'un site, on est souvent amené à corriger des petits bugs, bien souvent après qu'ils se soient déclarés. En automatisant certaines tâches, de manière quotidienne ou hebdomadaire, on peut être alerté plus rapidement des éventuels problèmes ou mettre en place un système de monitoring sur certaines données.

  • Scripts SEO

    Tester la validité d'un proxy avec Ruby

    18 Aug 2013

    Pour ne pas se faire refouler par Google quand on lui envoie trop de requêtes en automatique, il est important de se munir de proxies. Mais encore faut-il qu'ils soient valides ! Qu'ils soient publics ou privés, l'important, c'est donc de pouvoir tester leur validité avant d'entamer toute action de scraping.

  • Scripts SEO

    Comparer deux sets d'URLs avec Ruby

    11 Aug 2013

    Dans le cadre d'une refonte, souvent, les URLs d'un site sont modifiées et générées selon de nouvelles règles : ajout de répertoires, modification du séparateur d'URL, renommage de catégories, etc. Cela oblige donc à créer tout un paquet de redirections, afin d'assurer une transition correcte en termes de PR, d'indexation et de trafic moteur. Je vous propose ici un petit script Ruby, qui vous permettra de préparer le terrain en matchant vos anciennes URLs avec les nouvelles...

  • Outils SEO

    Scraper Google avec deux plug-ins Chrome

    29 May 2013

    Quand on n'a pas Scrapebox ou RDDZ sous la main pour scraper les résultats de Google, il est intéressant de disposer d'outils qui pourront faire le travail malgré tout. Je vais donc vous présenter une petite méthode 'artisanale' pour récupérer les résultats de Google en quelques clics.

  • Administration Serveur

    Ajouter un X-Robots-Tag avec Nginx

    18 Apr 2013

    Un article très court pour une fois. Pour ceux qui passent de Apache à Nginx et qui souhaiteraient savoir comment ajouter un X-Robots-Tag dans le header http, voici quelle est la manière de procéder.

  • Scripts SEO

    Scraper facilement avec Ruby et Nokogiri

    15 Apr 2013

    Le scraping est l'une des actions qui fait partie du quotidien d'un SEO. On peut s'en servir par exemple en phase d'audit pour extraire le contenu de certaines balises, en phase de netlinking pour extraire les résultats Google, etc. Je vais vous présenter ici un petit script ruby réalisé avec l'aide de @clement_, et qui vous sera peut-être utile si vous n'avez pas sous la main un logiciel approprié. Vous pourrez l'exécuter directement en console et récupérer ainsi rapidement ce dont vous avez besoin.