Quelle est la durée de vie de mes articles sur mon site ? Python

Durée de vie Articles Marketing

Cet article reprend l’essentiel des 2 articles précédents :

cette fois avec Python.

Rappelons la question que l’on, se pose : Quelle est la durée où, en moyenne, mes articles « apportent » du trafic sur mon site Web ?

Nous ne détaillerons pas toutes les explications ici, merci de vous reporter aux articles avec R au besoin.

De quoi aurons nous besoin ?

Python Anaconda

Anaconda est une version de Python dédiée aux Data Sciences. Rendez vous sur la page de téléchargement d’Anaconda Distribution pour télécharger la version qui vous convient selon votre ordinateur.

Jeu de données

Vous pouvez soit utiliser nos données pour tester le programme :

Soit, créer votre propre jeu de données à partir de vos statistiques Google Analytics, en suivant la procédure sur les articles précédents :

Code source :

Copiez/Collez les codes sources suivants ou récupérez le code en entier sur notre Github : https://github.com/Anakeyn/ArticleLifetimePython .

Chargement des bibliothèques utiles

Et aussi, paramétrage de votre environnement.

Récupération des fichiers de pages vues et des articles.

Attention ces fichiers doivent être dans le répertoire courant de votre code source.

Calcul du trafic « Articles Marketing »

Il s’agit du trafic en rapport avec les pages d’articles que l’on souhaite investiguer. On les obtient à partir du trafic des « pages de base ».

Distribution du trafic des articles marketing à x mois

On va créer une fonction pour déterminer cela pour n’importe quel mois.

POUR LE MOIS I :

Distribution PV articles marketing mois 1
Distribution PV articles marketing mois 1

POUR LE MOIS 2 :

Distribution PV articles marketing mois 2
Distribution PV articles marketing mois 2

POUR LE MOIS 10 :

Distribution PV articles marketing mois 10
Distribution PV articles marketing mois 10

POUR LE MOIS 40 :

Distribution PV articles marketing mois 40
Distribution PV articles marketing mois 40

Pour nos données, on constate visuellement que dès le 10ème mois, les pages articles marketing n’apportent plus de trafic.

Nous allons vérifier cela statistiquement avec un SIGN.test. En Python nous utiliserons le test de rang de Mann-Whitney qui permet de tester une alternative « supérieur ». Ici on teste l’hypothèse H0 trafic = 0 pages vues et H1 trafic > 0.

Significativité du trafic « articles marketing » dans les mois suivants la publication.

Utilisation du test de Mann-Whitney pour tester la significativité du trafic « Articles Marketing »

Durée de vie Articles Marketing
Durée de vie Articles Marketing

Comparatif Statistique vs taille de l’échantillon

PV > 0 vs taille échantillon
PV > 0 vs taille échantillon

Autre méthode : calcul de l’intervalle de confiance pour une proportion

Voir dans l’article avec R pour les explications.

Proportion Pages Vues > 0
Proportion Pages Vues > 0

On obtient le même résultat qu’avec le test de Mann-Whitney, soit le mois 10.

Résultats pour les valeurs lissées

Pour les valeurs lissés nous allons utiliser une fonction Loess développée par James D. Triveri : http://www.jtrive.com/loess-nonparametric-scatterplot-smoothing-in-python.html.

Effectuons nos calculs et créons le graphique :

Proportion lissée PV > 0
Proportion lissée PV > 0

Significativité du trafic « direct marketing » dans les mois suivants la publication.

On répète l’opération précédente pour les pages « Direct Marketing ». Il s’agit des pages dont l’entrée s’est faite via une page article marketing.

Utilisation du test de Mann-Whitney pour tester la significativité du trafic « DIRECT Marketing »

Durée de vie Articles Direct Marketing
Durée de vie Articles Direct Marketing

Comparatif Articles Marketing vs DIRECT MARKETING LISSE

Comparatif Articles Marketing vs Direct Marketing
Comparatif Articles Marketing vs Direct Marketing

Significativité du trafic « unique marketing » dans les mois suivants la publication.

Il s’agit des pages « Marketing » visitées uniquement suite à une entrée sur la même page « Marketing ».

Durée de vie pages Unique Marketing
Durée de vie pages Unique Marketing

Proportions lissées, comparatif ArtIcles Marketing, Direct Marketing ET UNIQUE MARKETING

Comparatif Articles Marketing vs Direct Marketing vs Unique Marketing
Comparatif Articles Marketing vs Direct Marketing vs Unique Marketing

Conclusion

Le test de Mann Whitney et la fonction Loess utilisée en Python donnent des résultats légèrement différents de ceux que nous avons obtenus avec SIGN.test et la fonction Loess de R.

Ici l’efficacité se situe entre 9 et 21 mois selon que l’on a une vision restrictive et/ou que l’on travaille avec des données brutes ou non.

Comme, nous l’indiquions précédemment, ces résultats ne valent que pour un seul site et un groupe d’articles et il serait intéressant de refaire cette démarche pour d’autres sites et ou pages.

N’hésitez pas à communiquer vos résultats en commentaires.

A Bientôt,

Pierre

Laisser un commentaire

Votre adresse de messagerie ne sera pas publiée. Les champs obligatoires sont indiqués avec *

Ce site utilise Akismet pour réduire les indésirables. En savoir plus sur comment les données de vos commentaires sont utilisées.