Applications, icebergs et un peu de crack : comment Snowflake veut bouleverser le paysage des données

Zeg niet data warehouse...

Selon Snowflake, le Summit 2022 sera l’occasion de faire les annonces les plus importantes depuis des années. Sous le soleil du désert de Las Vegas, l’entreprise a exposé les domaines dans lesquels elle apporte une valeur ajoutée et ceux dans lesquels elle veut aller. Est-il temps de considérer le cloud de données ?

L’année dernière, Alison Tierney, vice-présidente senior EMOA de Snowflake, nous a réprimandés pour avoir osé décrire la société comme un spécialiste de l’entreposage de données. Snowflake ne l’aime pas, et on l’a encore découvert au Summit 2022. Lors de sa présentation, Chris Degnan, directeur du revenu, a critiqué les fournisseurs de services en cloud qui veulent positionner Snowflake dans le segment des entrepôts de données. « Ils le font parce qu’ils n’ont aucune réponse à notre offre réelle », a déclaré Degnan. « Nous sommes le cloud des données. »

Partager, c’est devenir plus intelligent

Voilà qui définit le climat. À Las Vegas, Snowflake fait tout pour faire comprendre qu’il est un acteur isolé dans le segment auto-inventé du cloud de données. Bien sûr, Snowflake offre des fonctionnalités de lac de données et d’entrepôt de données, mais ce n’est que le début. La mission de Snowflake est de permettre aux organisations de tirer de leurs données non seulement des informations, mais aussi des revenus.

Il est possible de le faire en partageant les données de Snowflake avec d’autres organisations de manière sécurisée, ou en intégrant des ensembles de données de tiers à ses propres données. Les données historiques de température sont un bon exemple, car ces données provenant d’une partie externe peuvent donner une nouvelle idée lorsqu’elles sont combinées avec les chiffres de vente réels des shorts et des parapluies.

Croissance turbo

Selon les initiés de Snowflake, la conférence de Las Vegas est la plus importante depuis une demi-décennie. Les annonces faites ici montrent la direction que la société souhaite prendre dans les années à venir, à savoir attirer plus d’invités et de partenaires que jamais. Snowflake lui-même a grandi comme un chou pendant la période corona et a enregistré 1,2 milliard de recettes au cours du dernier exercice, soit une croissance annuelle de cent pour cent. Le résultat est une conférence quelque peu chaotique, où la confiance en soi acquise ne peut masquer les petits problèmes de croissance.

lees ook

HP Zbook Studio G9

Sur scène, le PDG Frank Slootman n’est pas gêné par cette situation. Il décrit comment son entreprise se voit aujourd’hui. « Snowflake n’est pas seulement une base de données avec une infrastructure. Notre objectif est bien plus important que de faire fonctionner des bases de données dans le cloud. Nous voulons offrir une pile complète avec une place de marché, la monétisation, le développement d’applications, l’exécution de la charge de travail et plus encore. »

Les données ne viennent pas à l’appli …

Le développement d’applications et le marché : voilà le point central du Sommet 2022. « En 2014, Snowflake et l’ambition de bouleverser le paysage de l’analyse sont nés », souligne Christian Kleinerman, vice-président senior chargé des produits. « En 2018, on a voulu collaborer en réinventant. » Puis Snowflake a évolué vers le cloud de données : une plate-forme de partage et de vente de données en toute sécurité.

« Il est temps de bouleverser le développement des applications », affirme Kleinerman. À cette fin, Snowflake apporte des applications aux données. La configuration est simple : les clients de Snowflake ont leurs données dans le cloud et utilisent la plate-forme Snowflake pour les gérer et y accéder, sans silos. Snowflake lui-même fonctionne sur AWS, Google et Azure, et fournit une couche d’abstraction qui fait peu de différence pour le client quant à l’emplacement de l’infrastructure sous-jacente. La plate-forme Snowflake a accès à une source quasi inépuisable de puissance informatique dans le cloud.

… c’est l’appli qui vient aux données

Lors du sommet 2022, Kleinerman présente les Native Apps. Il s’agit d’applications qui utilisent les données Snowflake et s’exécutent comme des applications sans serveur au sein de la plate-forme elle-même. Les clients n’ont donc pas à dupliquer ou à déplacer les données : les applications viennent elles-mêmes aux données.

Le terme « application » est employé dans un sens large. Dans l’environnement de développement Snowflake, les développeurs peuvent même désormais travailler avec Python pour développer des applications. Snowflake s’assure automatiquement que les bibliothèques Python les plus importantes du canal Anaconda Default sont installées sur la plate-forme.

En outre, Snowflake intègre Streamlit, qu’elle a racheté en mars. Streamlit permet aux applications d’apprentissage automatique d’être visualisées de manière pratique via un frontal que les développeurs peuvent construire avec quelques commandes à code réduit.

Des données aux idées

Nous voyons le résultat de tout cela lors d’une démonstration : avec relativement peu de code, une organisation fictive, Sportco, peut entraîner un modèle d’apprentissage automatique sur ses données via Python dans Snowpark. Sportco peut ensuite intégrer ce modèle dans une application d’inférence. L’exemple concret concerne la relation entre le budget publicitaire dépensé sur différents canaux et les recettes. À partir de données historiques, le modèle conclut quel sera l’impact, par exemple, d’une augmentation des dépenses en publicités vidéo sur les ventes en magasin.

Via Streamlit, cette application reçoit ensuite un front-end avec un graphique pratique et des curseurs qui permettent aux utilisateurs professionnels de saisir le montant qu’ils souhaitent dépenser dans un canal publicitaire particulier. L’application peut être partagée via un lien.

« L’utilisateur doit toutefois avoir accès à Snowflake », explique Benoit Dageville, cofondateur et président du produit chez Snowflake. C’est logique : l’application fournit des informations basées sur des données, et ces données ne sont accessibles qu’aux utilisateurs disposant des bons droits. La gouvernance des données est l’un des principaux objectifs de Snowflake, qui n’en fera pas trop avec les applications natives.

Snowflake espère utiliser l’intégration de Python, entre autres, pour convaincre les développeurs d’écrire leurs applications avec les données, mais se rend compte que cela nécessitera un changement de culture. Techniquement, c’est très bien, mais il faut encore que les gens et les entreprises prennent le train en marche.

Des idées à un nouveau modèle de rémunération

Quoi qu’il en soit, Snowflake offre une incitation : du revenu. Grâce à l’ancien Data Marketplace, devenu Snowflake Marketplace, vous pouvez proposer vos applications à d’autres utilisateurs Snowflake (externes). Le Marketplace est une boutique d’applications où vous pouvez faire payer votre application par le biais d’une redevance mensuelle et éventuellement d’une redevance supplémentaire par requête.

Les applications natives sont donc une extension du cloud de données. Après tout, les organisations peuvent déjà proposer des ensembles de données via le marché. Avec les applications, cependant, les entreprises peuvent vendre des informations, sans exposer leurs données.

Dans l’exemple, Sportco peut proposer son application avec un modèle formé dans le magasin. Une autre entreprise peut alors acheter et installer cette application par le biais du magasin. Cela se fait automatiquement, dans l’environnement Snowflake de l’acheteur. L’acheteur ne peut pas voir le code source ou les données sur lesquelles l’application est basée.

Toutefois, le client peut relier ses propres données à l’application Sportco afin d’en tirer ses propres conclusions grâce au modèle d’inférence élaboré par Sportco. En revanche, Sportco, en tant que fournisseur de l’application, ne voit pas les données que l’acheteur saisit, car l’application fonctionne sans serveur dans l’environnement du client. En pratique, cela permet à l’acheteur d’appliquer les informations de Sportco à ses propres données, tout en préservant la confidentialité des données de chacun.

Plusieurs connexions forment un cloud

Les applications natives représentent le plus grand changement dans la façon dont les organisations peuvent utiliser Snowflake. Ils viennent s’ajouter aux salles blanches de données introduites précédemment, où différentes entreprises peuvent collaborer en toute sécurité sur la base des données gérées en toute sécurité de chacune d’entre elles.

Snowflake
Frank Slootman, PDG de Snowflake, constate que sa plate-forme se transforme rapidement en un véritable cloud, grâce à la multiplication des connexions de données entre différentes organisations.

Le résultat est un cloud de données en expansion constante. « Aujourd’hui, nous avons déjà 1 550 bords stables », déclare Frank Slootman, PDG de Snowflake. Stable edges est le terme utilisé par Snowflake pour désigner les connexions de données structurelles et durables entre différentes entreprises. « Vingt pour cent des clients ont au moins un bord stable et les clients qui dépensent un million de dollars ou plus avec nous en possèdent presque tous un. » Snowflake se concentre sur la valeur ajoutée que créent ces connexions. Voilà pourquoi on parle de cloud de données, et non de lac de données ou d’entrepôt de données.

Transactions et Apache Iceberg

Snowflake n’oublie cependant pas l’essentiel, à Las Vegas. Le partage des données avec des tiers n’est possible que lorsqu’elles sont accessibles sur la plate-forme Snowflake. À cette fin, nous voyons beaucoup d’annonces. Par exemple, Snowflake lui-même recevra des optimisations afin que la saisie des données soit plus rapide et moins coûteuse.

En outre, Snowflake est fier de présenter Unistore, qui permet aux entreprises d’intégrer soudainement des charges de travail transactionnelles dans Snowflake. Les données transactionnelles diffèrent des données analytiques classiques car elles évoluent plus rapidement et sont donc stockées dans des formats différents. Grâce aux tables hybrides et à un nouveau moteur de stockage, Snowflake comble désormais le fossé entre les données analytiques et transactionnelles.

Apache Iceberg
Christian Kleinerman, vice-président senior chargé des produits, considère la compatibilité avec Apache Iceberg comme un grand pas en avant pour la plate-forme Snowflake.

En outre, Kleinerman montrera également sur scène l’intégration d’Apache Iceberg. « Iceberg est un format ouvert qui définit les tableaux », explique Kleinerman. Le format est adapté aux grandes tables écrites en Parquet. Snowflake supportera Apache Iceberg en tant qu’alternative à son propre format de table mais offrira les mêmes fonctionnalités.

Connectez votre propre serveur

Cette démarche crée de nouvelles possibilités. Grâce à la prise en charge du format de tableau ouvert, Snowflake peut soudainement parler à des ensembles de données qui n’ont pas été intégrés à Snowflake dès le départ. Plus précisément, il devient possible d’utiliser des données sur site avec Snowflake.

Selon Tierney, les données sur site sont une nouvelle source de données pour Snowflake. « Il y a des ensembles de données que les organisations ne mettront jamais dans le cloud, comme les données de la Défense. En étendant Snowflake à ces ensembles de données sur site, les organisations peuvent utiliser les données de la plate-forme. En élargissant Snowflake à ces ensembles de données sur site, les organisations peuvent utiliser les données de la plate-forme. » Snowflake démolit quand même un mur important, ou du moins un peu. Les données sur site sont exécutées sur le matériel du client et non dans le cloud, avec toutes les conséquences liées aux performances. « Une requête sur ces données prend du temps. Il y a plus de latence. C’est la responsabilité du client. »

La plate-forme Snowflake gère donc plus de données dans plus de formats et provenant de plus de sources. Elle le fait plus efficacement qu’auparavant. Les silos entre les données font partie de l’histoire et même entre les organisations, les murs élevés laissent apparaître des portes. Chaque entreprise détermine qui peut voir quelles données, et tient compte de cette gouvernance lorsqu’elle partage des ensembles de données avec des parties externes. Avec les applications natives, il devient même possible de partager des informations et des fonctionnalités basées uniquement sur des données, sans que personne en dehors de l’organisation ne voie jamais les données sources.

Indépendant

Oui, Snowflake est un entrepôt de données. Mais ce n’est pas la raison pour laquelle le centre de convention Ceasars Forum éclate au grand jour et qu’une entreprise comme Novartis confie ses données sensibles à la plate-forme. Loïc Giraud, responsable mondial de la livraison numérique chez le géant pharmaceutique suisse, l’explique joliment : « Les développeurs de médicaments et l’industrie médicale au sens large doivent collaborer davantage. La collaboration apporte la simplicité, ce qui permet de commercialiser les médicaments plus rapidement. Lorsque nous avons essayé de mettre en place une telle collaboration indépendante, tout a échoué. Les concurrents remettent en question notre indépendance. Un acteur technologique véritablement indépendant fait la différence dans ce domaine. »

Novartis utilise désormais Snowflake pour combiner ses propres données avec celles des hôpitaux participants aux essais de nouveaux médicaments, ce qui ne serait pas possible sans la plate-forme. Giraud : « De tels essais impliquent de nombreux départements internes et des parties externes. Les tests sont conçus, nous devons trouver des patients, sélectionner les pays et les hôpitaux appropriés pour l’étude, surveiller le test… Avec Snowflake, nous rassemblons toutes les données et pouvons les interconnecter avec des données externes, ce qui accélère toute la procédure. »

Novartis fait entièrement confiance à Snowflake pour ses données et pense que le modèle de cloud de données est l’avenir. « Nous avions déjà évolué vers une stratégie de type cloud first », explique Giraud, « mais nous avons maintenant décidé de migrer toutes nos applications informatiques vers le cloud d’ici à 2026. Nous voulons seulement le cloud. » L’enthousiasme pour Snowflake est grand, donc elle espère en tirer parti à Las Vegas.

Cybersécurité à la mode !

Si Snowflake réunit toutes les données et est totalement sécurisé, pourquoi ne pas utiliser la plate-forme comme base de la sécurité informatique ? C’est dans cet esprit que nous entendons parler avec enthousiasme de la nouvelle « charge de travail Snowflake pour la cybersécurité ».

L’entreprise constate, par l’intermédiaire d’Omer Singer, que les équipes de sécurité sont confrontées aux mêmes problèmes que les autres départements d’une organisation : les données sont en silos, trop de travail est effectué manuellement et il est difficile de prendre des décisions éclairées. Il est vrai que ce problème est inhérent à toutes les branches de toutes les organisations qui sont en pleine transformation numérique et qui veulent tirer de la valeur de leurs données. L’objectif de Snowflake est de fournir une réponse à cette question, alors pourquoi pas pour les données de cybersécurité ?

Affaires dangereuses

Singer donne quelques exemples. Par exemple, les organisations peuvent combiner les données relatives à la sécurité et aux journaux avec les données relatives aux RH, car toutes les données se trouvent dans Snowflake. C’est pratique, c’est indiscutable. Il serait sans doute judicieux que les acteurs de la sécurité commencent à proposer massivement leurs services par l’intermédiaire de Snowflake, et nous comprenons que Singer aime nous montrer les capacités de Snowflake sous le prisme de la cybersécurité.

La sécurité est peut-être un sujet sensible, mais c’est là que nous pensons que Snowflake se trompe un peu. En pratique, les acteurs de la sécurité font chacun leur propre affaire aujourd’hui. La consolidation des solutions de sécurité auprès d’un seul acteur résout en grande partie les problèmes de corrélation, d’automatisation et de visibilité des données, sans que Snowflake ne joue un rôle. Nous doutons que les entreprises comme Fortinet, Sophos et Check Point veuillent à tout prix se tourner vers Snowflake. Peut-être qu’il est encore trop tôt pour cela.

Par ailleurs, faut-il concentrer votre sécurité sur un fournisseur d’entrepôts de données (pardon, clouds de données) ? C’est possible pour qui le veut. Le partenaire Securonix est très enthousiaste à Las Vegas. En définitive, il s’agit d’une question d’écosystème. Le « Workload for Cybersecurity » est une boîte vide que Snowflake aime voir remplie par des partenaires de sécurité.

Une fois essayé, définitivement séduit

Quoi qu’il en soit, Snowflake semble être sur la bonne voie, malgré le rebondissement de son action. Les investisseurs craignent que Snowflake ne soit un produit un peu cher, mais les bobos de Snowflake contredisent sans surprise cette affirmation. Ils n’ont pas tort : le stockage des données étant totalement indépendant des charges de travail que vous y exécutez, le coût du stockage reste le même, quoi que vous fassiez. « Pour les données, vous payez 23 dollars par téraoctet et par mois chez Snowflake », explique Singer.

Kapase prend également beaucoup de temps pour souligner l’importance du marché, tant pour Snowflake lui-même que pour ses partenaires. L’entreprise vise un chiffre d’affaires de dix milliards de dollars d’ici à 2029. La confiance dans le produit est élevée, et avec raison. Les entreprises qui libèrent leurs données et extraient efficacement la valeur du cloud de données en se connectant à des parties externes ne voudront pas revenir à un monde avec moins de visibilité. « En fait, nous vendons du crack », a avoué Dageville à certains analystes. « Mais en bien ! »

newsletter

Abonnez-vous gratuitement à ITdaily !

Category(Required)
This field is for validation purposes and should be left unchanged.
retour à la maison