Analyse du trafic selon les canaux avec R

Evolution trafic de base vs trafic Direct Marketing selon les canaux depuis 2011

Dans cet article nous allons investiguer la typologie des sources de trafic ou canaux et nous allons aussi comparer ces sources selon le type de pages : « pages de base » et « pages marketing ».

Pour notre étude, il serait intéressant de dissocier les
différents canaux de trafic :

  • le trafic suite à un email : email,  
  • le trafic via un site quelconque : referral,
  • le trafic via les réseaux sociaux : social,
  • le trafic via des moteurs de recherche : search.

Pour voir leurs différentes contributions dans le temps.

Malheureusement, comme on le verra plus loin, ces informations sont difficiles à obtenir. Nous verrons comment faire pour avoir une information, à peu près pertinente.

Comment procéder ?

Logiciel R :

Téléchargez le Logiciel R sur le site du CRAN https://cran.r-project.org/, ainsi que l’environnement de développement RStudio ici : https://www.rstudio.com/products/rstudio/download/.

Jeu de données

Comme dans les précédents articles, nous utiliserons le jeu de données de Networking Morbihan pour illustrer notre propos : Soit : les données de trafic récupérées de Google Analytics et nettoyées et la liste des « articles marketing » .

Vous pouvez aussi construire votre jeu de données à partir de vos propres données Google Analytics. Auquel cas, vous devrez suivre les procédures que nous avions décrites dans des articles précédents :

Reportez-vous aussi à cet article sur la durée de vie des articles sur un site Web pour voir les concepts d’Articles Marketing, Direct Marketing et Unique Marketing.

Code Source :

Vous pouvez récupérer les différents bouts de code ci-dessous ou récupérer tout le code sur notre Github à l’adresse https://github.com/Anakeyn/TrafficChannelsR.

Chargement des bibliothèques et récupération des données :

On procède comme précédemment :

Identification des canaux via la variable Medium

Celle-ci devrait permettre de différencier le trafic en provenance des moteurs de recherche, des réseaux sociaux, des webmails et d’autres sites référents.

On obtient mes résultats suivants

Les données ne sont pas très fiables, on a un gros paquet (none) qui correspond au trafic « direct » :

Google Analytics ne sait pas classer de nombreuses sources qu’il considère comme directes – c’est-à-dire que l’internaute a tapé directement l’URL du site dans la barre d’adresse – mais qui peuvent en fait provenir d’autres sources comme par exemple :

  • les favoris ou bookmarks choisis par l’internaute,
  • les favoris ou bookmarks automatiques, par exemple les « sites les plus couramment visités » lors de l’ouverture d’un nouvel onglet dans les navigateurs récents,
  • les liens dans des e-mails ouverts dans un logiciel d’emails classique comme OutLook ou Thunderbird (pas un webmail),
  • les liens depuis une campagne de liens sponsorisés mal traquée,
  • les liens dans un document (.doc, .xls, .pdf, etc.),
  • les liens dans un SMS,
  • les liens dans un outil de messagerie instantanée (Skype, Google Hangouts,..), 
  • les liens passant de page en https vers une page en http ou inversement ou en navigation privée via son navigateur,
  • les liens depuis une application pour smartphones et tablettes,

On devra donc se contenter de cette imprécision à ce niveau.

Identification des canaux via la variable Source

Investiguons la variable « source » :

Il y a 311 sources différentes. Voici les plus fréquentes

On retrouve nos « (none) » en « (direct) ».

On va regrouper les canaux « à la main » et les récupérer dans le fichier mySourcesChannel.csv.

Analyse du trafic Global

On va traiter les données concernant le trafic Global :

Graphique en Barre sur toute la PEriode

Trafic par canaux depuis 2011
Trafic par canaux depuis 2011

Graphique en barre par ANNEES

Trafic par canaux et par ans
Trafic par canaux et par ans

EVOLUTION DES PAGES VUES SELON LES CANAUX

Evolution du trafic selon les canaux.
Evolution du trafic selon les canaux.

Analyse du trafic de base

Comme on l’a vu dans des précédents articles, le trafic de « base » est le trafic pour les pages hors trafic créé grâce aux « articles marketing »

GRAPHIQUE TRAFIC DE BASE DEPUIS 2011

Trafic de base selon les canaux depuis 2011
Trafic de base selon les canaux depuis 2011

trafic de base par annees

Trafic de base selon les canaux par ans
Trafic de base selon les canaux par ans

EVOLUTION DU TRAFIC DE BASE SELON LES CANAUX

Evolution du trafic de base selon les canaux depuis 2011
Evolution du trafic de base selon les canaux depuis 2011

Analyse du trafic Direct Marketing

Nous nous concentrons sur le trafic « Direct
Marketing » i.e.  le trafic dont le
point d’entrée est un page « Articles Marketing » qui nous semble le
plus pertinent ici.

Graphique ARTICLES DIRECT MARKETING dePUIS 2011

Trafic Direct Marketing selon les canaux depuis 2011.
Trafic Direct Marketing selon les canaux depuis 2011.

Graphique ARTICLES DIRECT MARKETING PAR ANS

Trafic Direct Marketing selon les canaux par ans
Trafic Direct Marketing selon les canaux par ans

GRAPHIQUE EVOLUTION DU TRAFIC DIRECT MARKETING SELON LES CANAUX DEPUIS 2011

Evolution du Trafic Direct Marketing selon les canaux depuis 2011
Evolution du Trafic Direct Marketing selon les canaux depuis 2011

L’importance du trafic « direct » et « social » montre un trafic du à une forte activité Marketing.

Comparatif trafic de base vs trafic Direct Marketing

EVOLUTION DANS LE TEMPS

Evolution trafic de base vs trafic Direct Marketing  selon les canaux depuis 2011
Evolution trafic de base vs trafic Direct Marketing selon les canaux depuis 2011

Graphique des CANAUX EN PROPOrTION Direct MArketing / Base

Proportions Direct Marketing / Base selon les canaux
Proportions Direct Marketing / Base selon les canaux

Le trafic « Referral « est plutôt un trafic pour les pages de base, et plus spécifiquement pour la page d’accueil du site qui génère généralement le plus de liens externes.

Rem : la significativité des proportions a été testé avec la fonction prop.test de R :

On s’en doutait un peu, mais les Articles Marketing on un trafic qui comporte plus de trafic de Webmail et de réseaux sociaux. Cela semblait évident mais c’est mieux en le démontrant :-).

Pour aller plus loin dans l’analyse des canaux, nous ferons une Analyse en Composantes Principales dans un prochain article.

A Bientôt,

Pierre

Laisser un commentaire

Votre adresse de messagerie ne sera pas publiée. Les champs obligatoires sont indiqués avec *

Ce site utilise Akismet pour réduire les indésirables. En savoir plus sur comment les données de vos commentaires sont utilisées.