Blog

Comment récupérer des données Google Search Console dans Dataiku DSS 6.0

Dans cet article nous verrons comment récupérer les données de « Performance Web » de votre site (notamment les mots clés) de Google Search Console dans Dataiku Data Science Studio 6.0. Nous ferons ensuite différents traitements sur ces données. Ceci vous permettra de voir une partie de l’étendue des possibilités de DSS dans la manipulation de données … Continuer la lecture de « Comment récupérer des données Google Search Console dans Dataiku DSS 6.0 »

Machine Learning sur des données Yooda avec Dataiku DSS 6.0 (partie 1)

Dans cet article, nous allons voir comment utiliser différents algorithmes de Machine Learning avec Dataiku DSS 6.0. Afin d’avoir un élément de comparaison nous allons utiliser les mêmes données que dans notre article Recherche de facteurs SEO avec le Machine Learning (partie 1) ou nous avions fait nos calcul avec R. Les données sont dans … Continuer la lecture de « Machine Learning sur des données Yooda avec Dataiku DSS 6.0 (partie 1) »

Installation et prise en main de Dataiku DSS 6.0 sous Windows 10

Dans cet article nous verrons comment installer Dataiku DSS 6.0 sur un ordinateur sous Windows 10. Nous verrons aussi quelques exemples d’utilisation. Qui est Dataiku ? Dataiku est une société technologique spécialisé dans les logiciels pour les sciences de données. Bien qu’aujourd’hui basée à New-York, Dataiku a été créé à Paris notamment par des anciens … Continuer la lecture de « Installation et prise en main de Dataiku DSS 6.0 sous Windows 10 »

Classification de pages Web via Deep Learning – Réseau de Neurones Convolutif

Cet article fait partie d’une série d’articles sur la classification de pages Web dans Google via le Deep Learning. Cette série a démarré par un article sur l’utilisation d’un réseau de neurones à propagation avant ou perceptron multicouches simple. Nous allons cette fois utiliser un Réseau de Neurones Convolutif pour résoudre notre problème. Traditionnellement les … Continuer la lecture de « Classification de pages Web via Deep Learning – Réseau de Neurones Convolutif »

Calcul d’un score BERT pour le référencement SEO

Dans cet article nous verrons comment calculer un « score BERT » pour déterminer si une page web est susceptible de répondre à une question posée dans Google. Pour ceux qui n’auraient pas fait attention, l’algorithme BERT a été déployé sur les résultats de Google pour l’anglais aux US depuis le 25 octobre 2019, et depuis le … Continuer la lecture de « Calcul d’un score BERT pour le référencement SEO »

Classification de pages Web via Deep Learning – Réseau de Neurones à propagation avant

Précédemment, nous avions vu, dans une série d’articles l’utilisation d’algorithmes de Machine Learning pour la classification de pages Web. Il s’agissait, dans notre cas, de déterminer la position d’une page dans Google sur un mot clé en fonction de caractéristiques liées à la page ou au site. Dans cette nouvelle série d’articles, nous allons nous … Continuer la lecture de « Classification de pages Web via Deep Learning – Réseau de Neurones à propagation avant »

Anakeyn TF-IDF Keywords Suggest

Anakeyn TF-IDF Keywords Suggest est un outil de suggestion de mots clés pour le SEO et le Web Marketing. Cet outil récupère les x premières pages Web répondant à une requête dans Google. Ensuite, le système va récupérer le contenu des pages afin de trouver des mots clés populaires ou originaux en rapport avec le … Continuer la lecture de « Anakeyn TF-IDF Keywords Suggest »

Optimisation des hyper paramètres XGBoost via un Algorithme Génétique

Cet article est le dernier d’une série sur le Machine Learning avec Python. Il fait suite à l’article : Classification de pages via le Machine Learning sur un univers de concurrence avec Python – II Dans cet article précédent, nous avions notamment calculé un modèle XGBoost avec des paramètres standards sur nos données de pages … Continuer la lecture de « Optimisation des hyper paramètres XGBoost via un Algorithme Génétique »

Classification de pages via le Machine Learning sur un univers de concurrence avec Python – II

Cet article fait suite aux 5 articles précédents : Classification de pages Web pour le SEO via le Machine Learning avec Python Récupérez des données de positionnement de vos pages via Google Search Console API Modèle Interne : test de classification de pages via le Machine Learning pour un seul site Classification de pages via … Continuer la lecture de « Classification de pages via le Machine Learning sur un univers de concurrence avec Python – II »

Scraping des pages Web pour enrichissement avant Machine Learning

Cet article fait suite aux 4 articles précédents : Classification de pages Web pour le SEO via le Machine Learning avec Python Récupérez des données de positionnement de vos pages via Google Search Console API Modèle Interne : test de classification de pages via le Machine Learning pour un seul site Classification de pages via … Continuer la lecture de « Scraping des pages Web pour enrichissement avant Machine Learning »