Le Marketing de contenu amène-t-il du trafic sur mon site Web ? Logiciel R

Evénements significatifs et dates des articles en 2014

Et voilà la question à 1 MD de $ que tout Web Marketeur et dans ce cas, tout rédacteur Web se pose : Est-ce que mon travail sert à quelque chose ?

Plus particulièrement, nous allons nous intéresser à la contribution au trafic d’un site Web, notamment en SEO, qu’apporte la création d’articles et la mise en œuvre d’actions Web Marketing connexes .

On entend par actions connexes des actions du type :

  • distribution du contenu sur les réseaux sociaux
  • récupération de liens entrants suite à la publication de l’article
  • emailing pour annoncer l’article
  • Eventuellement publicité Adwords, FaceBook, Instagram…
  • ….

Avec la console Google Analytics

Une première approche pour répondre à notre question sur la contribution d’un article serait de le vérifier dans Google Analytics.

Rem : Comme dans d’autres articles précédents nous illustrerons notre propos avec des données issues du site de l’association Networking Morbihan.

Pour avoir une idée de la contribution d’un article sur une longue période, nous vous conseillons d’étudier un article ancien.

Dans notre cas, l’article « rentrée-2011 » a été publié le 1er septembre 2011. C’est l’un des premiers articles dont la date est certaine. Notre période d’étude va du 1 juillet 2011 au 31 décembre 2018 soit 7 ans 1/2.

Pour avoir une vue du trafic d’une seule page , allez sur Comportement   -> Contenus du site -> Toutes les Pages, puis cliquez sur une page ou un article ancien qui vous intéresse.

Trafic article  "rentrée 2011"
Trafic article « rentrée 2011 »

Comme on le voit sur le graphique, cet article a été vu essentiellement
au moment ou il a été publié. Il faut dire qu’il a bénéficié au moment de la
publication :

  • D’une mise en évidence sur la page d’accueil du site.
  • D’une communication via email.
  • De la création d’un événement dans Viadéo.
  • De la diffusion sur FaceBook.
  • De la diffusion sur Twitter.
  • De liens externes créés par les membres

Notons toutefois, que l’on ne peut pas évaluer dans Google Analytics si le trafic supplémentaire constaté est significatif par rapport au trafic « normal ou de base » du site, ou au trafic attendu du site si nous n’avions pas publié l’article et les articles précédents. 

Il n’est pas possible non plus de comparer plusieurs articles ou encore d’avoir une information synthétique sur tous les articles.

Avec R :

C’est pourquoi il est intéressant de travailler avec des outils et langages statistiques tiers comme R ou Python. Dans cet article nous traiterons le problème avec R.

La question précise que l’on va se poser ici est : « Est ce que, après avoir publié un article, j’obtiens des pics de trafic significatifs le jour même ou les jours suivants ? »

Pour avoir une idée de cela de façon visuelle, nous allons ajouter les dates de publications de nos articles à la courbe des pages vues et des événements significatifs réalisée précédemment :

Evénements significatifs depuis 2011
Evénements significatifs depuis 2011

De quoi aurons-nous besoin ?

Logiciel R

Bien que je l’ai indiqué partout précédemment je vous redonne l’information : afin de pouvoir tester le code source de cette démonstration nous vous invitons à télécharger Le Logiciel R sur ce site https://cran.r-project.org/, ainsi que l’environnement de développement RStudio ici : https://www.rstudio.com/products/rstudio/download/.

Jeu de données

Vous pouvez soit tester le code source avec nos données que vous pouvez récupérer ici en ce qui concerne les données de trafic récupérées de Google Analytics puis nettoyées. Et ici en ce qui concerne les dates des articles publiés sur notre site.

Soit, si vous souhaitez utiliser vos données, nous vous conseillons de suivre les étapes décrites dans les articles précédents suivants :

Code Source

Vous pouvez copier/coller les bouts de code dans les zones de code ou sinon tout télécharger depuis notre Github : https://github.com/Anakeyn/ArticlesPubDateVSSignTrafficR.

Récupération des données de pages vues :

Les données sont récupérées à partir du fichier dfPageViews.csv et mises en forme pour avoir un enregistrement par jour. Les « anomalies » i.e. les jours avec un trafic significativement important sont aussi repérées.

Récupération des articles :

En fait, ce qui nous intéresse est de récupérer la date de publication de tous les articles publiés qui nous intéressent.

Si vous utilisez un CMS (Content Management System), vous devez pouvoir faire cela assez facilement.

Dans notre cas, nous utilisons WordPress. WordPress dispose d’un outil d’export qui permet de récupérer des fichiers .xml d’articles.

Un petit bémol toutefois : l’outil d’export ne permet pas de sélectionner les catégories d’articles qui nous intéressent en une seule fois. Nous seront donc obligés de faire plusieurs exports et de récupérer des données dans 6 fichiers .xml.

Comme on l’a vu précédemment vous pouvez récupérer les 6 fichiers .xml sur notre github : https://github.com/Anakeyn/ArticlesPubDateVSSignTrafficR/raw/master/WP.articles.zip

Dézipper l’archive et placez les fichiers dans le répertoire de votre programme R.

Problème de date :

Nous avons besoin de la date pour merger le jeu de données des articles avec les dates et le jeu de données du trafic journalier.

Le problème est que la date dans les articles est sous la forme anglophone « Tue, 04 Nov 2014 12:23:53 +0000 » et en chaîne de caractère, et ne peut pas être décodée si votre ordinateur est en « locale » France.

On va devoir passer en anglais le temps du décodage.

Merge des articles et des données de trafic dans myArticle

Graphique des événements vs date de publication depuis 2011.

Sur ce graphique on compare les événement significatifs détectés (voir article précédent) aux dates de publications des articles.

Evénements significatifs et dates de publication des articles
Evénements significatifs et dates de publication des articles sur toute la période

Comme on le voit sur la courbe, vers les années 2017 2018 (numéros de jours importants) les actions ne sont plus très efficaces. Pour les autres périodes, ce n’est pas très lisible. C’est pourquoi nous allons diviser le graphique par années.

Graphiques par années

Pour 2011 (à partir de juillet)

Evénements significatifs et dates des articles en 2011
Evénements significatifs et dates des articles en 2011

Pour 2012

Evénements significatifs et dates des articles en 2012
Evénements significatifs et dates des articles en 2012

Pour 2013

Evénements significatifs et dates des articles en 2013
Evénements significatifs et dates des articles en 2013

Pour 2014

Evénements significatifs et dates des articles en 2014
Evénements significatifs et dates des articles en 2014

PoUR 2015

Evénements significatifs et dates des articles en 2015Evénements significatifs et dates des articles en 2015
Evénements significatifs et dates des articles en 2015

Pour 2016

Evénements significatifs et dates des articles en 2016
Evénements significatifs et dates des articles en 2016

Pour 2017

Evénements significatifs et dates des articles en 2017
Evénements significatifs et dates des articles en 2017

Pour 2018

Evénements significatifs et dates des articles en 2018
Evénements significatifs et dates des articles en 2018

La visualisation par années confirme ce que l’on constatait sur le graphique global. Il semble que parfois la publication soit suivie d’effets, parfois non. Ceci nécessiterait une étude plus approfondie des différents cas.

Dans un prochain article nous nous intéresserons plutôt à la « durée de vie » des articles sur un site Web.

Merci pour vos témoignages et suggestions en commentaires

A bientôt,

Pierre

Laisser un commentaire

Votre adresse de messagerie ne sera pas publiée. Les champs obligatoires sont indiqués avec *

Ce site utilise Akismet pour réduire les indésirables. En savoir plus sur comment les données de vos commentaires sont utilisées.