Angèle – Est-ce vraiment le Brol ?

Pour cette fin d’année, intéressons-nous à un sujet plus léger, à savoir la chanteuse Angèle et son album Brol.

Véritable phénomène de l’année 2018, la chanteuse belge Angèle, jusque là inconnue du grand public, a réussi a être couronnée d’un disque de platine pour son premier album « Brol » le 6 décembre 2018, soit seulement 2 mois après sa sortie.

Festival des Vieilles Charrues 2018 - Angèle - 011

La question qui vous brûle les lèvres est je le sens : « Mais… cet album, est-ce vraiment le brol ?

C’est ce que nous allons analyser.

Avant profitons-en pour Tout Oublier :

Dans cette étude nous allons nous intéresser à la distribution des vers des chansons d’Angèle en fonction de la taille en caractères.

De quoi aurons nous besoin ?

Logiciel R

Comme précédemment, merci de télécharger Le Logiciel R sur ce site https://cran.r-project.org/, ainsi que l’environnement de développement RStudio ici : https://www.rstudio.com/products/rstudio/download/, afin de pouvoir tester vous même le code source.

Fichier de données

Nous avons créé un fichier Excel qui regroupe l’ensemble des vers des chansons de l’album Brol. installez le dans le même répertoire que votre projet R.

Code Source

Vous pouvez copier/coller les morceaux de code source dans un script R pour les tester.

Chargement des bibliothèques

Attention ! si vous n’avez pas installé certains packages dans votre environnement RStudio, vous devez dé-commenter ceux qui vous intéressent.

Le fichier récupéré a la structure suivante :

J’ai aussi divisé chaque morceau en parties : « couplet », « refrain », « intro », « pont », « outro » mais nous ne nous en servirons pas ici.

Normalité de l’album

En premier lieu vérifions la normalité de l’album !! Ici, nous utilisons un test de shapiro. Si la p valeur < 0.05 la normalité n’est pas retenue.

Visualisons le graphique :

Normalité des chansons

Testons la normalité chanson par chanson :

Visualisons le graphique :

Distributions par chanson

Regardons les courbes de densité chanson par chanson :

La Thune

Balance ton quoi

Jalousie

Tout oublier

La Loi de Murphy

Nombreux

rem : c’est celle qui ressemble le plus à une courbe normale

Victime des réseaux

Les Matins

Je veux tes yeux

Ta Reine

Flemme

Flou

Comparatif des distributions

Essayons de comparer les distributions sur un seul graphique :

Le graphique n’est pas très lisible : c’est le brol !

Comparatif des chansons deux à deux

pour cela nous allons utiliser le SIGN.test de R.

i.e

hypothèses :

  • Hypothèse nulle : La médiane des différences entre les paires de longueurs de vers des 2 chansons est égal à zéro
  • Hypothèse alternative : La médiane des différences entre les paires de longueurs de vers des 2 chansons est différente de zéro.

si la p.valeur > 0.05 l’hypothèse nulle n’est pas rejetée.

Les chansons les plus « ressemblantes » sont :

Les chansons les plus « différentes » sont :

Visualisons la boite de dispersion pour l’ensemble des p valeurs :

Conclusion

Bon ben c’est bien le brol !

Je vous souhaite de bonnes fêtes !

Laisser un commentaire

Votre adresse de messagerie ne sera pas publiée. Les champs obligatoires sont indiqués avec *

Ce site utilise Akismet pour réduire les indésirables. En savoir plus sur comment les données de vos commentaires sont utilisées.