Re:Invent 2024 : AWS se concentre entièrement sur l’IA

AWS a de nouveau sorti le grand jeu lors de re:Invent 2024. L’événement annuel de Las Vegas était placé sous le signe de l’intelligence artificielle (IA), et le géant du cloud l’a clairement montré.

AWS entend montrer à re:Invent 2024 non seulement qu’elle est prête pour l’avenir de l’IA, mais qu’elle façonne elle-même cet avenir. La conférence rassemble quotidiennement plus de 60 000 visiteurs, clients et partenaires, qui assisteront tous à des centaines de sessions techniques ainsi qu’à des annonces innovantes.

De nouveaux outils, une nouvelle infrastructure et une vision future de la genAI qui devrait aider les entreprises à transformer la technologie en résultats concrets… AWS veut clairement être le numéro un du cloud.

De trois à quatre blocs de construction

Le discours de Matt Garman, à l’occasion de son premier re:Invent en tant que PDG, a donné un aperçu de l’avenir de l’informatique dématérialisée. « Il n’y a jamais eu de période plus excitante pour les entreprises qui traversent cette transformation, grâce à toutes les technologies que des acteurs comme AWS mettent sur le marché », a déclaré M. Garman. Plus de 60 000 visiteurs ont suivi l’événement en direct, tandis que 400 000 autres se sont connectés en ligne pour suivre les annonces. AWS s’est présenté comme un partenaire essentiel pour les entreprises qui souhaitent continuer à innover.

AWS a présenté sa vision d’un avenir où l’IA est au cœur de son infrastructure cloud. Cette vision s’articule autour de quatre blocs de construction : le calcul, le stockage, les bases de données et un nouveau pilier, l’inférence, qui vise spécifiquement à mettre en œuvre des modèles d’IA.

« Je pense que l’inférence générative de l’IA deviendra un élément essentiel de toute application. En effet, je pense que l’IA générative a le potentiel de transformer tous les secteurs, toutes les entreprises, tous les flux de travail et toutes les expériences des utilisateurs. Il suffit de regarder ce qui se passe déjà », a précisé M. Garman.

L’inférence générative de l’IA devient une composante essentielle de toute application.

Matt Garman, PDG d’AWS

Néanmoins, les trois éléments classiques restent essentiels. Le calcul, le stockage et les bases de données constituent la base de l’infrastructure cloud AWS. L’inférence garantit que les modèles d’IA fournissent des réponses correctes dans un contexte donné. « L’inférence est notre prochaine étape logique pour rendre l’IA non seulement évolutive, mais aussi utilisable dans les opérations quotidiennes », a déclaré M. Garman.

Tout au service de l’IA

Lors de re:Invent, AWS a clairement indiqué qu’elle souhaitait que l’IA devienne le cœur de ses services. L’une des annonces les plus marquantes a été celle des outils Nova d’ Amazon. Il s’agit de quatre nouveaux modèles de texte et de modèles de génération de photos et de vidéos. En outre, les agents d’IA Amazon Q Developer et Q Business ont également été mis à jour. « Avec Q, nous ne nous contentons pas de fournir de l’aide, nous accélérons également l’innovation », a souligné M. Garman.

lire aussi

Amazon Bedrock s’enrichit de nouvelles fonctionnalités

Amazon Bedrock a également fait l ‘objet d’une mise à jour majeure. Bedrock permet d’accéder aux modèles genAI, y compris ceux d’AWS et de fournisseurs tiers tels qu’Anthropic. De nouvelles fonctionnalités telles que la distillation de modèles facilitent la construction (ou la construction) de modèles d’IA plus petits et plus efficaces, tandis que les contrôles de raisonnement améliorent la fiabilité des résultats de l’IA.

La collaboration multi-agents serait une fonctionnalité puissante pour automatiser des flux de travail compliqués. Moody’s l’a illustré en montrant comment il a permis de préparer des rapports financiers en une heure au lieu d’une semaine.

Calcul : de Graviton à genAI

Le calcul reste l’un des éléments les plus importants de la stratégie d’AWS. L’entreprise affirme que le processeur Graviton 4 , lancé récemment, est 40 % plus rapide et 30 % plus performant que le Graviton 3. M. Garman a cité l’exemple de Pinterest, qui a économisé 47 % de ses coûts informatiques grâce à son passage au Graviton. « Quatre-vingt-dix des 1 000 premiers clients EC2 utilisent déjà Graviton », a-t-il ajouté.

Pour les entreprises qui forment des modèles d’IA, AWS introduit les Ultraserveurs Trainium 2. Il s’agit de puces d’entraînement. Avec 83 pétaflops, ces serveurs sont censés offrir une efficacité sans précédent. Garman a également annoncé Trainium 3, la nouvelle génération de puces d’entraînement à l’IA qui sera disponible en 2025 et devrait être 40 % plus économe en énergie.

Stockage plus rapide, bases de données plus intelligentes

Le stockage et les bases de données ont également fait l’objet d’une grande attention. Amazon S3 Tables promet des performances d’interrogation jusqu’à trois fois plus rapides et des transactions par seconde jusqu’à dix fois plus élevées pour Apache Iceberg, ce qui est parfait pour l’analyse de données à grande échelle. S3 Tables n’est que la deuxième extension du format S3 bucket d’AWS, après l’introduction de S3 Express l’année dernière.

Pour les entreprises submergées par des données non structurées, AWS a introduit S3 Metadata qui met automatiquement à jour les métadonnées afin de rendre la gestion des ensembles de données et des flux de travail plus efficace.

L’innovation pour les bases de données a été Amazon Aurora DSQL, une base de données SQL qui promet une évolutivité illimitée et ne nécessite aucune gestion d’infrastructure. DynamoDB prend désormais en charge la multirégion. Cela permet d’accélérer le processus de gestion des bases de données dans différentes régions sans se heurter à des problèmes de validation.

Efficacité et durabilité dans les centres de données

AWS a également apporté des améliorations à son infrastructure. Les innovations en matière de refroidissement et de gestion de l’énergie ont permis d’accroître l’efficacité du centre de données de 12 %. Ces améliorations réduisent les pannes et augmentent la capacité à exécuter des charges de travail lourdes telles que la genAI.

lire aussi

Re:Invent 2024 : AWS se concentre entièrement sur l’IA

Atmosphère explosive

Re:Invent continue d’être une expérience qui prend complètement possession de Las Vegas, ou du moins des hôtels dans lesquels elle se déroule. Des halls gigantesques remplis de milliers de visiteurs, des événements de réseautage dans des hôtels luxueux et un programme chargé de conférences, de sessions et d’ateliers.

L’événement a non seulement permis de découvrir différentes entreprises et leurs technologies, mais il a surtout été une source d’inspiration. Les visiteurs sont venus non seulement pour découvrir les dernières innovations, mais aussi pour s’informer auprès de grands noms de l’industrie (Benoît Dupin, d’Apple, a fait une apparition lors d’un discours liminaire !

AWS s’affiche à re:Invent comme un géant de la technologie qui ne cesse de se réinventer. Du calcul au stockage, en passant par les bases de données et l’inférence, les annonces montrent clairement l’ambition d’AWS d’intégrer l’IA dans toutes leurs applications.

Cette orientation n’est pas surprenante. Aujourd’hui, toutes les entreprises technologiques se targuent d’être des entreprises d’IA et AWS ne fait pas exception à la règle. Cependant, le géant du cloud a du retard à rattraper : AWS a pris le train de l’IA plus tard que son principal concurrent, Microsoft Azure, et doit faire comprendre que ses propres offres de cloud sont également idéales pour ceux qui veulent grignoter le gâteau de l’IA.

bulletin

Abonnez-vous gratuitement à ITdaily !

  • Ce champ n’est utilisé qu’à des fins de validation et devrait rester inchangé.