Quelle est la durée de vie de mes articles sur mon site ? R – II

Durée de vie Articles Marketing

Cette page est la suite de l’article Quelle est la durée de vie de mes articles sur mon site ? R – I

Suite du Code Source :

Vous pouvez aussi récupérer le source en entier sur notre Github à l’adresse : https://github.com/Anakeyn/ArticlesLifetimeR

Significativité du trafic « articles marketing » dans les mois suivants la publication.

Dans cette partie nous allons généraliser le calcul des distributions précédentes sur toute la période étudiée (7,5 ans) et vérifier à quel moment les « Articles Marketing » n’apportent plus un trafic significatif.

Statistiquement cela revient à tester pour tous les mois l’hypothèse :

H0 :  La médiane de la distribution est = 0 (i.e.  il y a plus de pages avec 0 vues qu’avec 1 ou plusieurs vues)

H1 : La médiane de la distribution est > 0

Afin d’effectuer ce test nous allons utiliser le SIGN.test qui est implémenté dans R. On utilisera ce test en comparant nos distributions par rapport à une distribution nulle.

Une p-valeur >0.05 indique que l’hypothèse H0 ne peut être rejetée.

Qu’est-ce que la p-valeur ?

Profitons-en pour rappeler la définition de la p-valeur dont on parle souvent ici !

Attention !!! Prendre son élan :

« Dans un test statistique, la valeur-p (en anglais p-value pour probability value), parfois aussi appelé p-valeur, est la probabilité pour un modèle statistique donné sous l’hypothèse nulle d’obtenir la même valeur ou une valeur encore plus extrême que celle observée. »

Bon, on retiendra la définition plus triviale :

« La p-valeur est la probabilité de se tromper en rejetant l’hypothèse nulle. »

Utilisation du SIGN.test de R pour tester la significativité du trafic « Articles Marketing »

Durée de vie Articles Marketing
Durée de vie Articles Marketing

Comme on le voit sur le graphique de la p-valeur, cela correspond à dire que l’apport de trafic cesse dès le 10ème mois.

Rem : on pourrait se poser la question de savoir si la p-valeur augmente du fait que la taille de l’échantillon de pages diminue. (ce qui est peu probable ici car on voit que les mois 11 et 12 sont meilleurs que le mois 10). Vérifions toutefois cela visuellement.

Comparatif Statistique vs taille de l’échantillon

Comparons la statistique, c’est-à-dire ici, les pages avec vues > 0, avec la taille de l’échantillon donnés par myNotNas, et la moitié de ce dernier.

PV > 0 vs taille échantillon
PV > 0 vs taille échantillon

Autre méthode : calcul de l’intervalle de confiance pour une proportion

Nous pourrions aussi résoudre le problème en calculant l’intervalle de confiance d’une proportion.

Cela peut vous êtes utile si vous n’avez pas un équivalent de SIGN.test dans votre langage.

Nous travaillons ici sur la proportion de pages avec vues > 0 vs la taille de l’échantillon pour un mois donné.

Pour le calcul on utilisera la formule approximative :

Intervalle de confiance

Où :

  • p est la proportion : pages avec vues > 0 / taille de l’échantillon pour le mois
  • n est la taille de l’échantillon
  • z est la valeur souhaitée pour le niveau de confiance,  par exemple :
    • 1,96 pour 95%
    • 2,57 pour 99 %

Proportion Pages Vues > 0
Proportion Pages Vues > 0

On obtient le même résultat qu’avec la méthode du SIGN.test, soit le mois 10.

Résultats pour les valeurs lissées

Par curiosité, recréons la courbe précédente en lissant les valeurs (méthode LOESS)

Proportion lissée PV > 0
Proportion lissée PV > 0

Restreignons l’investigation aux pages « Direct Marketing »

Comme nous l’avons indiqué précédemment, les pages « Direct Marketing » sont les pages visitées (Marketing ou non), uniquement suite à une entrée sur une page « Marketing ».

Remarque : Il reste 28553 observations.

Durée de vie Direct Marketing
Durée de vie Direct Marketing

Proportions lissées, comparatif ArtIcles Marketing et Direct Marketing

Comparatif DM AM
Comparatif DM AM

Restreignons encore aux pages « Unique Marketing »

Il s’agit des pages « Marketing » visitées uniquement suite à une entrée sur la même page « Marketing ».

il reste 21214 observations pour Unique Marketing.

Durée de vie pages Unique Marketing
Durée de vie pages Unique Marketing

Proportions lissées, comparatif ArtIcles Marketing, Direct Marketing ET UNIQUE MARKETING

Comparatif AM DM UM
Comparatif AM DM UM

Conclusion

Selon que l’on ait une vision restrictive des « Articles Marketing » ou que l’on utilise les données brutes ou les données lissées l’efficacité des Articles en terme de trafic supplémentaire varie de 7 mois à 21 mois.

Cette conclusion est valide juste pour le site étudié et les articles étudiés.  Il serait intéressant de généraliser ce type d’études avec de nombreux sites et groupes de pages ou d’articles pour pouvoir faire des comparatifs intéressants. 

Et vous qu’obtenez-vous comme résultats ?

A bientôt,

Pierre

Laisser un commentaire

Votre adresse de messagerie ne sera pas publiée. Les champs obligatoires sont indiqués avec *

Ce site utilise Akismet pour réduire les indésirables. En savoir plus sur comment les données de vos commentaires sont utilisées.