Test de l’API Insight de Yooda avec le logiciel R

Je profite de la sortie en bêta test de l’API Insight de Yooda pour faire un test avec le Logiciel R. Si vous souhaitez aussi tester l’API Insight, demandez un accès à Yooda sur cette page : Accès API en Bêta Gratuite.

Qui est Yooda / Aldeis ?

Yooda / Aldeis est une société française bien connue des référenceurs et Web Marketeurs et qui développe des outils SEO depuis 2002. Yooda propose notamment l’outil Insight qui est revendiquée comme la plus grande base de données de mots clés francophones.

Jusqu’à présent Yooda Insight était uniquement accessible via son site Web. Avec son ouverture via une API, Insight pourra maintenant s’intégrer à vos futures applications.

Logiciel R

Si vous ne l’avez pas encore fait, afin de pouvoir tester, reproduire et améliorer par vous même le code source de ce test, téléchargez Le Logiciel R sur ce site https://cran.r-project.org/, ainsi que l’environnement de développement RStudio ici : https://www.rstudio.com/products/rstudio/download/.

Que Propose l’API Insight ?

La documentation de l’API n’étant accessible que si vous avez une clé, vous trouverez ci-dessous les copies des images écrans principales qui résument les fonctionnalités de l’API.

Documentation API Insight Yooda

Comme vous pouvez le voir, l’API Insight permet d’accéder à 2 types d’informations : les informations sur un domaine et qui correspondent à l’option « Site Performance » sur le site de Yooda. Les informations par mot clé et qui correspondent à l’option « Market Explorer » sur leur site.

Yooda fournit aussi 2 outils pour gérer votre API : l’accès à votre crédit et à votre historique d’utilisation.

Docummentation Abonnnement API Insight

En revanche, ce que ne vous dit pas Yooda : c’est quelle est l’adresse de l’API et comment on construit l’URL d’interrogation 🙁 !!!! Mais bon on s’en serait douté :-).

Donc, l’API se trouve à l’adresse :
« https://api.yooda.com/ »
Et pour construire une URL d’Interrogation on suit les instructions en ajoutant les infos à l’URL de l’API. par exemple ici « https://api.yooda.com/insight/domains/yooda.com?apikey=xxxxxxxxxxxxx » retourne l’Id du domaine « yooda.com » avec « xxxxxxxxxxxxx » qui doit être renseigné par la clé d’API fournie par Yooda.

Test avec R

Dans ce test nous nous sommes posé 2 questions principales :
– Quelles sont les caractéristiques des mots clés qui concourent au trafic de « Yooda.com » ?
– Quels sont les mots clés uniques (attention pas les expressions) proches du mot clé « SEO » ?

Vous pouvez copier/coller les morceaux de codes source dans un script R pour les tester. N’oubliez pas de renseigner votre code d’API !!

Chargement des bibliothèques utiles
Les packages ne sont à installer qu’une seule fois dans votre environnement.

Clé d’API et vérification des crédits
La clé d’API a été fournie par Yooda !

[1] 9966053

Ouf ! il m’en reste un beau paquet !

I – On va travailler tout d’abord sur le domaine yooda.com

I-1 Récupération de l’ID du domaine yooda.com

[1] 12840941

I-2 – Récupérations des mots clés du domaine yooda.com
à partir de l’Id du site yooda.com. On va récupérer les données dans un data.frame.

‘data.frame’: 29 obs. of 11 variables:
$ domain_id : chr « 12840941 » « 12840941 » « 12840941 » « 12840941 » …
$ url : chr « https://www.yooda.com/ » « https://www.yooda.com/ » « https://www.yooda.com/ » « https://www.yooda.com/submit/ » …
$ position : int 1 3 3 1 1 2 3 1 3 2 …
$ score : chr « 69920 » « 22560 » « 4512 » « 1840 » …
$ traffic : int 699 226 45 18 15 11 8 7 5 4 …
$ keyword.kw_id : chr « 6104257 » « 130965642 » « 6162822 » « 6162821 » …
$ keyword.keyword : chr « yooda » « yooda insight » « seeurank » « yooda map » …
$ keyword.search_volume: int 1900 2400 480 50 40 90 90 20 50 30 …
$ keyword.competition : num 0.14 0.11 0 0.03 0.13 0 0.04 0.15 0 0.05 …
$ keyword.cpc : num 1.41 0.98 0 0 1.65 0 0 1.1 0 0 …
$ keyword.results_nb : int 113000 6810 28600 45200 11400 43000 19500 28400 19600000 1500 …

I-3 – Préparation des données

I-4 – Exploration des données (1)
Visualisation des données récupérées, pour voir ce que l’on a d’intéressant :-).


Jeu de données (data.frame) DataKeywords :

Jeu de données DataKeywords

I-5 – Exploration des données (2)
Résumés statistiques des variables numériques.

position traffic keyword.search_volume keyword.competition keyword.cpc keyword.results_nb
Min. : 1.000 Min. : 0.0 Min. : 10.0 Min. :0.0000 Min. :0.0000 Min. :1.16e+03
1st Qu.: 1.000 1st Qu.: 1.0 1st Qu.: 10.0 1st Qu.:0.0000 1st Qu.:0.0000 1st Qu.:1.97e+04
Median : 3.000 Median : 4.0 Median : 10.0 Median :0.0500 Median :0.0000 Median :8.73e+04
Mean : 3.138 Mean : 36.9 Mean : 184.8 Mean :0.1824 Mean :0.3466 Mean :7.77e+06
3rd Qu.: 4.000 3rd Qu.: 7.0 3rd Qu.: 40.0 3rd Qu.:0.1400 3rd Qu.:0.0000 3rd Qu.:2.17e+06
Max. :10.000 Max. :699.0 Max. :2400.0 Max. :0.9600 Max. :2.0800 Max. :1.44e+08

I-6 – Exploration des données (3)
Tests d’histogrammes


Histogrammes DataKeywords

Alors que beaucoup de mots clés sont positionnés en 1er, un seul semble apporter un fort trafic…

I-7 – Exploration des données (4)
Tests de boites de dispersion


Boites de dispersion DataKeywords

Pas grand chose à en dire, je vous laisse vous faire votre opinion.

I-8 – Exploration des données (5)
Tests de nuages de points

Nuages de Points DataKeywordsNum

Pas très lisible : trop de variables.

I-9 – Exploration des données (6)
Intéressons-nous plus particulièrement au trafic des mots-clés vs les autres variables.


Nuages de points Traffic vs autres variables numériques

La forme en « trompette » du dernier graphique (Traffic vs keyword.search_volume) nous semble intéressante.

I-10 – Visualisation de données
Investiguons plus avant Traffic vs keyword.search_volume

Nuage de Points Trafic vs Volume de recherche

Le trafic et le volume de recherche sont liés (c’est à priori une évidence mais c’est bien de le constater 🙂 ). Notez que les mots clés positionnés en 1ere position pour le site Yooda.com amènent proportionnellement plus de trafic (points roses-orangés au dessus de la droite de régression linéaire) que les mots clés moins bien positionnés (ce qui n’est pas très étonnant non plus).

En revanche, la compétition sur un mot-clé n’apporte pas grand chose sur sa capacité à générer du trafic : comme quoi il y a encore des progrès à faire dans le choix des mots-clés par les annonceurs :-).

I-11 – Récupération des Indicateurs clés de Performance
On garde le même site : MyURL = « yooda.com »

$rank
[1] 180267
$traffic
[1] 1082
$kw_count
[1] 29
$pages_count
[1] 3
$competitors_count
[1] 19

II – travail sur un mot clé
l’idée ici est de faire un (beau) nuage de mots clés uniques (pas les expressions) des mots approchants notre mot clé cible :
Au hasard prenons ici « SEO » :-).

II-1 – Importation des données
on procède comme précédemment en allant cette fois récupérer l’Id du mot clé au préalable.

Expressions proches de SEO

II-2 – Nettoyage des données
Nous allons transformer les mots clés récupérés en un « Corpus » propre.

[1]  » search engine optimization definition search engine optimization web definition definition def o definition search optimization marketing quoi search optimization signification optimization web internet search engine optimization def search engine signification web internet marketing definition marketing search veut dire web search engine optimization definition optimization francais definition search engine optimization search engine optimization definition strategie definition quoi website marketing definition search engine optimization meaning score meaning definition marketing search optimization search search engine optimization search engine optimizer web search search engine marketing search engine optimization description web search search engine optimization tools definition score definition marketing definition definition francais engine optimization search services search marketing optimization search engine optimization search engine optimization optimize search engin…

II-3 – Préparation des données
Pour l’affichage d’un nuage de mots-clés « wordcloud » nous avons besoin d’une « data.frame » avec les fréquences pour chaque mot clé.

Diagramme en barre 10 mots clés proches de SEO

II-4 – Visualisation d’un nuage de mots clés
Ici on affiche uniquement les 20 premiers mots clés en rapport avec SEO



Nuage de Mots clés proches de SEO

II-5 – Indicateurs clés de performance d’un mot clé
Pour finir profitons-en pour récupérer les indicateurs clés de performance du mot clé « SEO »

$items_count
[1] « 519 »
$total_search_volume
[1] « 28440 »
$average_cpc
[1] « 0.38 »

Retrouvez un autre exemple de l’utilisation de l’API Yooda Insight dans notre série d’articles sur la recherche de facteurs SEO avec le Machine Learning.

Merci pour votre attention. N’hésitez pas à faire vos remarques et suggestions d’amélioration dans les commentaires.

Pierre

Laisser un commentaire

Votre adresse de messagerie ne sera pas publiée. Les champs obligatoires sont indiqués avec *