Récupérez des données de positionnement de vos pages via Google Search Console API

Cet article est la suite de notre article de présentation sur le thème de la Classification de pages Web pour le SEO via le Machine Learning avec Python. Nous poursuivrons cette thématique sur plusieurs articles.

Dans celui-ci, nous nous attacherons à voir comment récupérer des données de positionnement « pages/requêtes/positions » via l’API de Google Search Console avec Python.

Python Anaconda

Logo Anaconda

Comme on l’a vu dans de précédents articles nous vous conseillons de télécharger la version de Python Anaconda qui vous convient selon votre ordinateur. Python Anaconda est une version de Python 3.xx adaptée aux Sciences de données.

Python Anaconda installe de nombreux dont un environnement de développement Spyder. Sur windows il apparait dans la rubrique Anaconda 3 :

Applications Anaconda

Spyder nous servira pour tester et faire tourner nos programmes Python. Notez aussi « Anaconda Prompt » qui permet d’avoir une console avec Python chargé et donc de rajouter des bibliothèques avec le gestionnaire de paquet ‘conda’. A préférer ici au gestionnaire habituel de Python : ‘pip’.

Code Source

Vous pouvez soit récupérer les morceaux de code source ci-dessous ou bien tout récupérer d’un coup sur notre Github à l’adresse : https://github.com/Anakeyn/GetDataGoogleSearchConsoleAPI.

Chargement des bibliothèques utiles

Si certaines bibliothèques sont manquantes dans votre environnement Python vous devez ouvrir une console prompt ou interface en ligne de commande et installer les paquets manquants avec conda ou pip.

Connexion à l’API de Google Search Console

Nous vous proposons ici 2 méthodes de connexion à l’API soit avec les IDs client et secret comme présenté dans la doc pour Google Search Console API V3, soit avec le fichier .json présenté dans la doc pour Google Analytics API V4

Récupération des données Pages/Mots-Clés/positions pour le mois de mai 2019

Dans notre cas nous avons 514 pages/expressions « positionnées » pour le moi de mai 2019. Si vous n’en avez pas beaucoup essayez d’allonger la période. Pas trop non plus, car dans le scrap des SERPS que l’on fera par la suite dans un autre article, correspondent à un univers récent.

Voici une partie des résultats que nous avons sauvegardés dans un fichier .csv à des fins de visualisation.

Pages Expressions Positions mai 2019
Pages Expressions Positions mai 2019

Dans le prochain article nous essaierons de créer un « modèle interne » de Pages/Expressions/Positions au moyen du Machine Learning.

A Bientôt,

Pierre

Laisser un commentaire

Votre adresse de messagerie ne sera pas publiée. Les champs obligatoires sont indiqués avec *

Ce site utilise Akismet pour réduire les indésirables. En savoir plus sur comment les données de vos commentaires sont utilisées.