Le data lake, vous ne vous y noierez plus !

La donnée, ce nouvel el dorado des entreprises. On peut en collecter – beaucoup – mais encore faut-il en dégager de la valeur. Le stockage et l’utilisation de la donnée sont devenus un enjeu primordial dans les entreprises. De nombreuses solutions sont disponibles : data warehouse ou le mystérieux data lake. Ce dernier est plébiscité par les entreprises de type IoT, mais pour quelles raisons et comment peut-on s’y retrouver ?

Lac de donnée

Designed by whatwolf / Freepik

 

Un lac de données ?

L’image est plutôt bien choisie pour définir ce modèle de base de donnée. Une base alimentée en amont de divers cours d’eau que sont les données provenant des différents services : ressources humaines, finance, commercial… Il en découle ensuite en aval de multiples possibilités de valorisation de cette donnée regroupée.

 

Mais concrètement, comment ça marche ?

Le principe général d’un data lake est la flexibilité. Il est nécessaire de ne PAS imposer de structure à la donnée entrante : chaque donnée entre comme elle est, brute ou très raffinée :

     Blob : images, audio, vidéo

     Donnée non structurée : emails, documents PDF

     Donnée semi-structurée : CSV, XLM

     Bases de données relationnelles : lignes et colonnes

Le Data Lake se différencie donc du Data Warehouse dans le sens où l’étape de transformation est déplacée à la fin de la procédure. Un entrepôt nécessite un classement, là où le lac mêle tout:  

Extract -> Transform -> Load

Extract -> Load -> Transform

Il en résulte finalement une utilisation simplifiée grâce au traitement de la donnée facilité.

En effet, le formalisme imposé par la structure réceptrice de la donnée réduit l’intensité des détails en appliquant des agrégats. En gardant l’information aussi brute que possible, le data lake réduit le risque d’amalgames. La lecture des données non modifiées du data lake « schema on read » : permet alors d’éviter les confusions.

 

Quelles utilisations marketing ?

P Du point de vue de l’utilisateur, l’analyse des données est souvent plus complexe. Il lui faut matérialiser sa demande, extraire les données nécessaires avant de les interpréter. L’ensillotage des données en data mart dans les data warehouse permettait d’avoir directement les insights. La lecture des données extraites d’un data lake demande donc de nouvelles technologies et peut faire peur aux profils les moins tech d’entre nous. Mais alors comment générer de la valeur sans se noyer dans cette masse de données ?

Pêcheur

People photo created by freepik

 

Segmenter pour mieux analyser

Pour s’y retrouver dans ce lac, notre première bouée est la segmentation. En effet, les multiples dimensions des données concernant les utilisateurs (âge, sexe, région, device…) et leur comportement (taux de scroll, achats…) permet de segmenter la population globale en différents groupes. L’application marketing vise ensuite à adresser une communication particulière à chaque groupe : message personnalisé via le canal le plus performant. La segmentation du data lake émet donc l’opportunité d’améliorer le ROI de vos campagnes marketing comme l’a fait Sofinco par exemple.

L’identification

Dans un logique encore plus micro, il est possible d’identifier les meilleurs clients, autrement dit, d’attribuer une valeur à vos prospects. Toutes les données d’un utilisateur sont synthétisées en un score qui retranscrit s’il est un prospect plutôt « froid » ou plutôt « chaud ». Cela permet donc de concentrer vos investissements marketing sur une population ayant une propension à convertir supérieur. A l’inverse, cela permet également d’adresser un message spécifique de réassurance aux populations les moins conquises.

Personnalisation, le marketing one-to-one

A l’aide d’algorithmes, vous pourrez pousser du contenu personnalisé, développer un système de recommandations, de cross-sell ou d’up-sell grâce à l’identification des besoins de chaque utilisateur. La donnée brute du data lake permet ici de coller au plus près des réels besoins.

 

Alors, vous vous laissez tenter ?

Les utilisations marketing d’un data lake sont si séduisantes qu’on y plongerez bien les deux pieds joints. Attention néanmoins à prendre vos précautions. Afin d’éviter que votre data lake ne se transforme en data swamp (marécage) le nécessaire est d’identifier les besoins stratégiques au préalable. Une vision claire de l’enjeu est la clé d’une utilisation réussie de la donnée.

 

Bonne baignade !

 

(Français)
Abonnez-vous à Make it digital

Recevez par email chaque lundi matin l'ensemble des articles publiés sur le blog Make it Digital. La garantie de suivre les dernières évolutions du digital !

Garantie sans spam.

Leave a Comment