Upsolver s’attaque à la complexité du data lake

Upsolver s'attaque à la complexité du data lake

Spécialiste de l’ingénierie des data lakes dans le cloud, la startup Upsolver lève 13 millions de dollars en série A. L’objectif de sa plateforme est d’aider les organisations à se focaliser sur l’exploitation des données plutôt que sur les tâches répétitives.

Avec le big data sont apparus les data lakes ou lac de données. Le data lake se destine au stockage de grands volumes de données brutes, structurées et non structurées. Il vise généralement à regrouper l’ensemble des données disponibles à des fins d’analyse, par exemple au travers d’algorithmes de machine learning.

Le déploiement de ces infrastructures est loin de s’être toujours avéré une réussite pour les entreprises. Son coût constitue également un point noir des projets de data lake. La tendance est donc désormais à leur externalisation dans le cloud.

Un data lake qui se transforme en data swamp

L’orchestration des data lakes dans le cloud, c’est justement le core business de la startup Upsolver. La société, basée en Israël et aux Etats-Unis, vient d’ailleurs de lever 13 millions de dollars. Cela porte ainsi le total à 17 millions depuis sa création.

Les capitaux doivent financer les investissements de la startup dans le domaine de la R&D, mais aussi le développement de ses équipes commerciales et de ses fonctions multi-cloud. Upsolver se décrit en effet comme un spécialiste des environnements cloud.

Sa plateforme ETL est conçue nativement pour les data lakes dans le cloud AWS. Pour son éditeur, il s’agit de libérer les équipes IT des entreprises des tâches les plus répétitives et les moins génératrices de valeur.

Des données plus simples à interroger

« Construisez sans effort des pipelines de données parfaits avec rien d’autre qu’une interface visuelle et le SQL que vous connaissez déjà » vante ainsi la startup dans sa présentation commerciale. Pour son PDG et cofondateur, Ori Rafael, les data lakes essuient des critiques récurrentes ces dernières années.

Nombre d’entre eux deviennent ainsi « des marécages de données » ou data swamp. Pour le dirigeant, « il est très facile d’y stocker des données à très bas prix, mais il est difficile de les rendre [faciles à interroger] et précieuses. »

Retirer de la valeur des données stockées au sein d’un data lake exige ainsi « beaucoup d’ingénierie ». Upsolver entend donc simplifier ces tâches d’ingénierie pour rendre plus facilement exploitables les données stockées.

La promesse : les ingénieurs big data peuvent se dédier aux problèmes de données les plus complexes. La plateforme de l’éditeur les débarrasse pour cela des opérations répétitives comme l’orchestration des tâches, les ETL et la gestion IT.

A lire également sur MyData

Qu'est-ce qu'un data lake ?

Qu’est-ce qu’un data lake : guide pour patron pressé

L’ère du big data a popularisé le data lake ou lac de données dans lequel les organisations regroupent l’ensemble de leurs données. La ruée a cependant pris fin. Qu’est-ce qu’un data lake ? A quoi sert-il ? On-premise ou dans le cloud ? Décryptage et bonnes pratiques.

A propos de Christophe Auffray 433 Articles
De formation initiale en marketing Web et en économie, je me suis spécialisé par la suite dans la presse B2B consacrée à l'économie numérique et dispose dans ce secteur de 15 ans d'expérience. Spécialiste de la transformation numérique, de l'innovation et des nouveaux business models des entreprises, j'ai développé des compétences dans les domaines du marketing éditorial, de la stratégie éditoriale, de la production de contenus premium et la gestion de sites d'information et d'équipe dans l'univers des médias en ligne et du marketing des solutions innovantes.