Téléphoner à Skaze

Actualités

Tout savoir sur... le Data Lake

28/01/2022

Le stockage et l'analyse de données sont au cœur des sujets en programmatique. C'est là que le Data Lake (ou lac de données) fait son apparition et prend tout son sens... Plateforme qui permet le stockage en volume et l'analyse de données sans limites de types ou de structures, nous vous proposons aujourd'hui de découvrir son fonctionnement, ses avantages et ses limites...

Tout savoir sur... le Data Lake

Qu'est-ce qu'un Data Lake et à quoi sert-il ?

Définition

Dans Data Lake, il y a data, et il est important de comprendre la définition que l'on donne à ce terme en programmatique aujourd'hui. La data concerne principalement les données qui sont recueillies sur les internautes lorsqu'ils naviguent en ligne ; elle ne concerne pas la récolte d'informations personnelles (telles que les noms adresses, e-mails, etc...). C'est donc une collecte que l'on peut considérer comme comportementale !

Aujourd'hui, il existe plusieurs solutions de stockage de données.
"Les plus classiques ont été inventées dans les années 1950, elles sont passées en bases relationnelles depuis les années 1980, et les plus connues vont être les bases SQL." mentionne notre CTO, Frédéric Bernard

Une source de données plus complète

"Plus récemment, il y a d'autres systèmes de bases de données qui sont apparus, comme le Data Lake. Il permet une autre façon de stocker la donnée." précise-t-il.
Un Data Lake permet de stocker de la data de façon très précise et structurée. Le but est d'entreposer la donnée reçue de la façon la plus rapide, et de s'adapter au plus grand nombre et typologies de données possibles. L'avantage, ce qu'il n'y a aucune contrainte en termes de type de fichier, de catégorie ou encore de taille.
Les données proviennent de sources diverses : serveurs web, bases de données externes...

"Un Data Lake permet des analyses beaucoup plus fines sur la data lorsqu'on sait ce que l'on cherche, contrairement à une base de données classique qui va avoir des limites." clôture Frédéric.

Pourquoi créer un Data Lake et en quoi est-ce bénéfique dans la gestion de campagnes ?

Une grande souplesse

"Notre Data Lake a vu le jour en 2016. Nous avons choisi ce type de stockage plutôt qu'une base de données classique car avec la quantité de data que nous avions à stocker dedans, cela nous permettait une plus grande souplesse. Certaines datas sont lourdes à stocker, et les données ne sont pas forcément les mêmes d'un annonceur ou d'un éditeur à l'autre." dévoile notre CTO.

Dans le Data Lake les données sont stockées de façon brute, il est possible de les retravailler comme on le souhaite derrière. Il est possible d'en faire des exports spécifiques selon les métiers, ou les données souhaitées, c'est un outil très agile.

Plus de précision

Cet outil permet donc d'être encore plus précis dans les campagnes car les données (navigation sur les sites web, les impressions des DSP, et plein d'autres petites datas) sont encore plus représentatives des clientèles cibles des annonceurs, et actualisées très fréquemment.

Des opportunités

Il nous a également permis la mise en place de certaines technologies.
Chez Skaze, par exemple, nous avons créé une DCO (Dynamic Creative Optimisation), basée sur les données du Data Lake. Elle offre la possibilité d'afficher une créa plus précise selon l'internaute et son parcours, et cela de façon très rapide.
Ce sont des données comme : ce qu'à vu l'internaute sur un site internet ; ou encore celles provenant des DSP qui permettent de connaître : les impressions, les clics, les visites et les ventes réalisées.

Nous avons également été capables de sortir une CDP (Customer Data Platform). Sur laquelle on retrouve une analyse de la data permettant de pousser des segments d'utilisateurs. Cela dans le but d'améliorer la qualité de notre diffusion publicitaire. Nous l'exploitons quotidiennement pour les campagnes de nos clients.

Un Data Lake a-t-il des limites ou inconvénients ?

Absence d'organisation

C'est un outil qui peut devenir difficile à gérer. Quand on stocke beaucoup de datas, ça peut être complexe de créer des exports si elle n'a pas été entreposée de manière un minimum structurée et organisée.
"Chez Skaze, on a plusieurs tera de données, donc sans organisation, ça peut vite devenir compliqué." explique Frédéric.

Manque de stratégie dans l'exploitation

Il faut savoir que les datas sont conservées et exploitables 12 mois afin de respecter les critères RGPD. Toutes les datas ne sont pas utiles dans l'immédiat, il faut donc prendre son mal en patience et attendre le moment stratégique et opportun (... mais pas trop non plus, sous peine de la laisser filer !)

Vous souhaitez des campagnes au ciblage encore plus précis ? Profitez de nos outils et de notre Data Lake dès demain en nous contactant !