Quelle est la durée de vie de mes articles sur mon site ? R – I

Distribution PV articles marketing mois 1

Dans cet article nous allons nous intéresser à la « durée de vie » de nos articles sur un site Web.

Autrement dit, la durée où, en moyenne, mes articles « apportent » du trafic sur mon site. Nous l’exprimerons ici en nombre de mois.

Cette problématique peut être intéressante, par exemple, si l’on veut comparer l’efficacité de différents rédacteurs, de différentes thématiques ou encore de différents sites …

Cet article étant un peu long il sera divisé en deux parties.

Comment allons nous procéder ?

Logiciel R :

Dans cet article nous allons utiliser R. Dans un prochain article nous procéderons avec Python.

Si vous ne l’avez pas encore fait, téléchargez le Logiciel R sur le site du CRAN https://cran.r-project.org/, ainsi que l’environnement de développement RStudio ici : https://www.rstudio.com/products/rstudio/download/.

Jeu de données

Comme précédemment, nous utiliserons les données du site de Networking Morbihan. On partira des données de trafic récupérées de Google Analytics et nettoyées et de la liste des « articles marketing »*.

Si vous souhaitez utiliser vos données, suivez les étapes décrites dans les articles précédents suivants, pour bien comprendre la démarche et créer vos propres fichiers :

* Pour le trafic « articles marketing » on considèrera 3 types de pages vues liées aux articles marketing, de plus en plus restrictives :

  • AM (Articles Marketing)  :  il s’agit les pages vues liées aux articles comme les pages vues des articles eux-mêmes et les pages vues des autres pages dont la page d’entrée serait une page « d’article marketing ».  ».  Rem : Le « trafic de base » correspond au reste des pages vues.
  • DM (Direct Marketing) : il s’agit du trafic des pages (Articles Marketing ou non) dont l’entrée s’est faite via une page article marketing.
  • UM (Unique Marketing) : il s’agit du trafic des pages articles marketing dont l’entrée s’est faite par la même page article marketing.

Code Source :

Vous pouvez récupérer les différents bouts de code ci-dessous ou récupérer tout le code sur notre Github à l’adresse https://github.com/Anakeyn/ArticlesLifetimeR.

Chargement des bibliothèques et récupération des données :

Calcul du « trafic de base »

Il peut être intéressant de déterminer au préalable le « trafic de base » : dfBasePageViews. On crée aussi un jeu de données du trafic de base par jour : BaseDaily_data

Trafic « articles marketing »

Il suffit de soustraire le trafic de base au trafic global. Créons aussi un jeu de données pour le trafic par jour.

Remarque : il reste 35207 observations pour les pages « Articles Marketing »

Comparatif trafic de base vs trafic articles marketing

Par curiosité, l’idée est ici de voir si les deux trafics sont corrélés. On pourra essayer de le voir graphiquement ou bien de calculer le Tau de Kendall (car ici la distribution n’est pas normale – je vous passe le détail 🙂 ).

Le Tau de Kendall se situe entre -1 et 1. Une valeur proche de 0 indique qu’il n’y a pas de corrélation. Une valeur positive indique une corrélation positive, une valeur négative une corrélation négative. Plus on s’approche de -1 ou 1, plus les variables sont corrélées.

Comparatif trafic de base vs trafic articles marketing
Comparatif trafic de base vs trafic articles marketing

Le graphique n’est pas très lisible. On peut juste voir que le trafic de base semble plus régulier. Il pourrait être intéressant de diviser le graphique en année, mais ce n’est pas le propos de cet article. Si vous êtes curieux allez-y !

Le Tau de Kendall donne une valeur de 0,39 ce qui indique une corrélation positive, ce à quoi on pouvait s’attendre, mais cette valeur n’est pas non plus énorme. Essayons en moyenne mobile :

Comparatif en moyenne mobile

Comparatif trafic de base vs trafic articles marketing en moyenne mobile.
Comparatif trafic de base vs trafic articles marketing en moyenne mobile.

C’est légèrement plus lisible, il y a des moments ou les courbes se suivent de près. Le Tau de Kendall est de 0,54 ce qui indique une corrélation positive un peu meilleure que précédemment.

A ce stade on constate qu’il y a une corrélation positive du trafic de base et du trafic articles marketing, ce qui parait somme toute logique, mais c’est mieux de le démontrer :-). Revenons à nos moutons …

Distribution du trafic des articles marketing à x mois

L’idée est ici de voir, au bout d’une période donnée (1,2 ,10 mois…), quels sont les trafics mensuels de mes différentes pages articles . Statistiquement, il s’agit d’afficher la distribution du trafic pour mes articles.

Pour faire cela nous avons créé une fonction que l’on pourra appeler pour chaque mois (cette fonction sera aussi utilisée pour le trafic Direct Marketing et pour le trafic Unique Marketing ) :

Pour le Mois 1

Distribution PV articles marketing mois 1
Distribution PV articles marketing mois 1

Pour le mois 2

Distribution PV articles marketing mois 2
Distribution PV articles marketing mois 2

Pour le mois 10

Distribution PV articles marketing mois 10
Distribution PV articles marketing mois 10

Pour le mois 40

Distribution PV articles marketing mois 40
Distribution PV articles marketing mois 40

Dans notre cas, on constate que, assez rapidement, vers le mois 10, les pages articles marketing semblent ne plus apporter de trafic.

On vérifiera cela statistiquement dans la suite de l’article.

Laisser un commentaire

Votre adresse de messagerie ne sera pas publiée. Les champs obligatoires sont indiqués avec *

Ce site utilise Akismet pour réduire les indésirables. En savoir plus sur comment les données de vos commentaires sont utilisées.