Analyse du trafic selon les canaux avec Python

Proportions Direct Marketing / Base selon les canaux

Cet article reprend l’article Analyse du trafic selon les canaux avec R, cette fois en utilisant le langage Python.

Par conséquent, nous ne reprendrons pas en détail toutes les explications et vous invitons à vous reporter à ce précédent article.

Toutefois rappelons de quoi il s’agit :

Nous allons investiguer ici la typologie des sources de trafic ou canaux, et nous allons aussi comparer ces sources selon le type de pages : « pages de base » et « pages marketing ».

Nous verrons comment obtenir à partir de Google Analytics une information à peu près pertinente sur les différents canaux.

De quoi aurons nous besoin ?

Python Anaconda

Anaconda est une version de Python dédiée aux Data Sciences. Rendez vous sur la page de téléchargement d’Anaconda Distribution pour télécharger la version qui vous convient selon votre ordinateur.

Jeu de données

Vous pouvez soit utiliser nos données pour tester le programme (dézippez les archives dans le même répertoire que le code source ):

Soit, créer votre propre jeu de données à partir de vos statistiques Google Analytics, en suivant la procédure sur les articles précédents :

Code source :

Copiez/Collez les codes sources suivants ou récupérez le code en entier sur notre Github : https://github.com/Anakeyn/TrafficChannelsPython

Chargement des bibliothèques et récupération des données de pages vues globales :

il s’agit pour nous du fichier dfPageViews.csv

Regardons ce que l’on a dans la variable medium :

organic 29678
(none) 21913
referral 19994
twitter 1215
facebook 15
sortir-en-bretagne 4
(not set) 2
Name: medium, dtype: int64

(none) correspond au trafic « direct » un peu fourre tout. les « referral » demanderons à être investigués.

Regardons dans la variable source

google 28089
(direct) 21913
facebook.com 3315
viadeo.com 2507
google.fr 1714
twitterfeed 1232
quaidesreseaux56.fr 882
images.google.fr 853
l.facebook.com 786
m.facebook.com 712
bing 690
t.co 652
designsgenius.com 517
linkis.com 511
localhost 505
linkedin.com 482
images.google 452
aleos2i.fr 443
fr.viadeo.com 374
yahoo 279
Name: freq, dtype: int64

On retrouve nos (none) en (direct)

On va regrouper les canaux « à la main » et les récupérer dans le fichier mySourcesChannel.csv.

Analyse du trafic Global

On va traiter les données concernant le trafic Global :

Graphique en barre sur toute la période

Trafic par canaux depuis 2011
Trafic par canaux depuis 2011

Graphique en barre par ANNEES

Trafic par canaux et par ans
Trafic par canaux et par ans

EVOLUTION DES PAGES VUES SELON LES CANAUX

Evolution du trafic selon les canaux.
Evolution du trafic selon les canaux.

Analyse du trafic de base

C omme on l’a vu dans des précédents articles, le trafic de « base » est le trafic pour les pages hors trafic créé grâce aux « articles marketing » . On le récupère dans le fichier dfBasePageViews.csv

GRAPHIQUE TRAFIC DE BASE DEPUIS 2011

Trafic de base depuis 2011
Trafic de base depuis 2011

trafic de base par annees

Trafic de base selon les canaux par ans
Trafic de base selon les canaux par ans

EVOLUTION DU TRAFIC DE BASE SELON LES CANAUX

Evolution du trafic de base selon les canaux depuis 2011
Evolution du trafic de base selon les canaux depuis 2011

Analyse du trafic Direct Marketing

Nous nous concentrons ici sur ce que l’on a appelé le trafic « Direct
Marketing » : il s’agit du trafic dont le point d’entrée est un page « Article Marketing ».

Graphique ARTICLES DIRECT MARKETING dePUIS 2011

Trafic Direct Marketing selon les canaux depuis 2011.
Trafic Direct Marketing selon les canaux depuis 2011.

Graphique ARTICLES DIRECT MARKETING PAR ANS

Trafic Direct Marketing selon les canaux par ans
Trafic Direct Marketing selon les canaux par ans

GRAPHIQUE EVOLUTION DU TRAFIC DIRECT MARKETING SELON LES CANAUX DEPUIS 2011

Evolution du trafic Direct Marketing selon les canaux depuis 2011.
EVOLUTION DU TRAFIC DIRECT MARKETING SELON LES CANAUX DEPUIS 2011

Comparatif trafic de base vs trafic Direct Marketing

EVOLUTION DANS LE TEMPS

Evolution trafic de base vs trafic Direct Marketing selon les canaux depuis 2011
Evolution trafic de base vs trafic Direct Marketing selon les canaux depuis 2011

Graphique des CANAUX EN PROPOrTION Direct MArketing / Base

Proportions Direct Marketing / Base selon les canaux
Proportions Direct Marketing / Base selon les canaux

Dans notre cas, le trafic « Referral » concerne surtout les pages de base, tandis que le trafic « Social » et « Webmail » les pages articles.

Pour finir, vérifions la significativité des proportions. On utilisera la fonction proportions_ztest de la bibliothèque stats de Python.

Pour finir cette série d’articles sur des données de trafic provenant de Google Analytics, nous ferons une Analyse en Composantes Principales sur les canaux, dans un prochain article.

A bientôt,

Pierre

Laisser un commentaire

Votre adresse de messagerie ne sera pas publiée. Les champs obligatoires sont indiqués avec *

Ce site utilise Akismet pour réduire les indésirables. En savoir plus sur comment les données de vos commentaires sont utilisées.