Zero-Copy : que peut-on apprendre de la norme canadienne d’intégration des données ?

2266001985

Beaucoup de copies, peu de contrôle : aujourd’hui, la plupart des organisations ne traitent pas les données très efficacement. Au Canada, les DSI s’unissent autour d’une nouvelle norme : Zero-Copy Integration. Elle devrait permettre de supprimer les copies de données et aider les organisations à se conformer à des réglementations telles que le GDPR.

Le problème de la prolifération des données va être résolu au Canada ? Avec Zero-Copy Integration, le pays tente au moins de le faire. Zero-Copy est une norme développée par la Data Collaboration Alliance, en partenariat avec des agences gouvernementales et des DSI canadiens. La norme doit permettre aux organisations de déployer des solutions numériques modernes sans transformer la gestion des données associées en un véritable casse-tête. Bien que Zero-Copy soit une initiative canadienne, le cadre constitue une excellente base pour la transformation numérique dans le monde entier.

Plus de demande pour les mêmes données

La norme Zero-Copy Integration est conçue dans un contexte où les entreprises et les clients exigent de plus en plus des expériences numériques idéalement connectées. Cela crée une prolifération d’applications qui doivent avoir accès aux mêmes données. À cette fin, les données de parfois des centaines de systèmes sont copiées dans des bases de données adaptées à quelques applications. Les développeurs adoptent cette approche (souvent par force) non seulement pour les applications externes. En interne aussi, les bases de données sont copiées à la chaîne pour prendre en charge différentes applications.

« Voilà un gaspillage de près de la moitié du budget informatique des entreprises du monde entier », explique à ce sujet Dan DeMers, président de la Data Collaboration Alliance. « De plus, c’est la raison pour laquelle les citoyens et les entreprises n’ont plus le contrôle de leurs propres données. » 82 % des entreprises gèrent plus de 10 copies de bases de données. Globalement, 65 % de toutes les données contenues dans les bases de données ne sont pas uniques.

Pourtant, il y a une solution. Il est possible d’éviter de copier des données en masse pour fournir certaines fonctionnalités grâce à plusieurs solutions numériques qui existent aujourd’hui. Partout dans le monde, des grandes entreprises innovantes en tirent déjà parti. Snowflake, par exemple, gagne sa croûte avec une solution basée sur le cloud qui permet aux applications, aux organisations et aux personnes, tant externes qu’internes, d’accéder aux données à partir du même ensemble de données central.

Principes de base

Les Canadiens prennent de l’avance avec une norme qui encourage et encadre ces pratiques. « Il faut oublier l’idée qu’il faut copier des données pour les partager », précise Keith Jansa, directeur exécutif du CIO Strategy Counsil au Canada. Zero-Copy Integration se présente comme un ensemble de six principes que les organisations, les développeurs, les administrateurs informatiques et les architectes de données devraient suivre pour éviter les copies inutiles.

  • La centralité des données est priorisée, ainsi que les métadonnées, pour le code complexe.
  • La modularité est préférée à la conception monolithique.
  • La gestion des données doit passer par une architecture de données partagée, et non par des bases de données spécifiques aux applications.
  • Le contrôle d’accès universel doit passer par la couche de données.
  • La gouvernance des données passe par les produits de données et l’accès fédéré, plutôt que par des équipes centralisées.
  • Les données sont partagées par le biais d’une collaboration basée sur les droits d’accès, et non sur des copies.

Adieu, base de données des applications

Expliquons un peu. Grâce à la centralité des données, Zero-Copy Integration veut s’assurer que les organisations considèrent les données comme leur principal patrimoine. Les données sont permanentes, alors que les applications vont et viennent. L’architecture des données prend donc le pas sur le développement des applications et en est en fait séparée. Les données se trouvent dans une bibliothèque virtuelle, les applications y peuvent les consulter.

La modularité se fonde sur ce principe. En développant un environnement modulaire, il est plus facile de travailler avec ces ensembles de données centraux. Cela contraste avec le développement d’applications monolithiques rigides, où il est plus difficile d’éviter une base de données propriétaire (copiée).

Cela vaut aussi pour le troisième point. Les bases de données spécifiques aux applications ne devraient en fait plus exister lorsque les applications sont modulaires et que les données constituent un actif principal central. Une base de données spécifique à une application ne devrait pas exister : toutes les données méritent leur place dans la base de données centrale.

Politique fédérée

Cela implique que la sécurité et les politiques doivent être au niveau des données. Via la couche de données, on accorde l’accès aux comptes et aux applications. Cela évite qu’un méli-mélo d’applications avec une multitude de comptes ne crée des droits d’accès différents pour ce qui est souvent les mêmes données (copiées). En attribuant des droits à toutes les données centralement, on garde une vue d’ensemble et le contrôle en tant qu’organisation.

Dans cette structure, il est possible de confier le contrôle des politiques de données aux spécialistes. Cela peut se faire en élaborant des politiques dans lesquelles les équipes individuelles peuvent travailler dans les limites de leurs propres droits d’accès, par exemple lors du déploiement d’une application. Cette approche contraste avec la gestion centralisée des accès effectuée par une seule équipe de données, qui a le contrôle ultime et final de tous les détails. Il est évident que quelqu’un porte la responsabilité finale, mais un système fédéré garantit que la liberté nécessaire aux équipes en bas de l’échelle sera conservée.

Enfin, la norme Zero-Copy stipule que tout accès aux données doit se faire par le biais de politiques et de droits d’accès. Il n’y a plus aucune raison valable de fournir aux titulaires de droits internes ou externes une copie des données, qui risque ainsi de mener sa propre vie. Le propriétaire des données conserve ainsi le contrôle final à tout moment.

Stratégie cloud-first

Pour les accès externes, cela implique clairement que Zero-Copy Integration adopte une approche « cloud-first ». Après tout, ce n’est qu’à cette condition qu’il est facile de donner aux parties externes un accès performant aux données. Les applications fonctionnant sur la base de données centrale attendent de la réactivité. S’il existe un fichier pour consulter ou modifier les données dans le dépôt central, la tentation de faire une copie rapide pour une base de données spécifique à l’application apparaît à nouveau et tout le plan Zero-Copy Integration s’écroule.

Zero-Copy Integration a de nombreux avantages. Les données ne prennent pas d’espace inutile sur les HDD ou SSD avec des copies superflues, les versions conflictuelles des données n’existent plus, le contrôle d’accès est facile, la vue d’ensemble est maintenue et les audits de conformité deviennent possibles.

Les Canadiens considèrent que la norme est intéressante tant pour les entreprises que pour le gouvernement et les citoyens. Pour les entreprises, une architecture de données moderne offre un moyen flexible de faire face à la transformation numérique. En séparant les données et les applications de manière réfléchie, il est plus facile de créer de nouvelles applications et de renoncer aux anciennes. De plus, lorsqu’on adopt Zero-Copy Integration largement, on crée une architecture capable de partager les données en toute sécurité et de manière contrôlée avec des parties externes. Là encore, on pense aux ambitions de Snowflake, dont le Data Cloud permet aux entreprises de combiner des ensembles de données externes avec leurs propres données, ou vice versa : ils peuvent rendre leurs propres données accessibles à des tiers.

Solid

Pour les utilisateurs particuliers, Zero-Copy est une norme qui fait suite à Solid, le projet de Tim Berners-Lee. Solid est une architecture de données qui s’appuie sur des coffres-forts de données. Ces coffres forment un dépôt central de données qui reste contrôlé par le propriétaire des données. Selon le principe de Zero-Copy, les applications (externes) peuvent utiliser les données, mais le coffre-fort reste son dépôt central.

Le gouvernement flamand n’est pas à la traîne du canadien à cet égard. Avec Zero-Copy Integration, le Canada voit émerger une norme qui bénéficie certainement d’un large soutien du monde informatique là-bas, mais nous expérimentons avec Solid. Les deux initiatives tentent d’apporter une solution à différentes facettes d’un même problème.

bulletin

Abonnez-vous gratuitement à ITdaily !

  • Ce champ n’est utilisé qu’à des fins de validation et devrait rester inchangé.