OVHcloud choisit SambaNova comme moteur de son nouveau service d’inférence IA

OVHcloud

OVHcloud s’associe à SambaNova pour fournir une inférence IA à très faible latence, ciblant les applications où la vitesse et la fiabilité sont cruciales.

Lors du sommet annuel OVHcloud à Paris, l’acteur européen du cloud annonce la prise en charge de l’infrastructure SambaStack de SambaNova pour les terminaux IA. SambaNova utilise des unités de flux de données reconfigurables (RDU), des puces spécialisées développées pour l’inférence IA. La technologie doit aider les organisations dans des tâches telles que le commerce financier, la cybersécurité, l’automatisation industrielle et l’optimisation logistique.

La collaboration vise à améliorer les performances en termes de « time to first token » et de « time per output token », deux paramètres importants lors de l’exécution de charges de travail IA à grande échelle. Le nouveau service est destiné à la fois aux applications en temps réel avec des performances garanties et aux API batch qui peuvent traiter de grandes quantités de requêtes lorsqu’une réponse immédiate n’est pas nécessaire. La disponibilité d’un SLA de disponibilité de 99,8 % indique qu’OVHcloud vise des environnements prêts pour la production.

Complément à l’offre GPU d’OVHcloud

L’infrastructure SambaNova complète les terminaux IA existants basés sur GPU d’OVHcloud. La technologie utiliserait plus efficacement l’énergie et la capacité des centres de données et fournirait plus de puissance de calcul par kilowattheure. Cela le rend approprié pour les agents IA, la traduction en direct, la communication agent à agent et le traitement par lots à grande échelle tel que l’exploration du Web ou le renouvellement de l’ensemble de données.

lire aussi

OVHcloud utilise l’IA pour une technologie de refroidissement durable dans les centres de données

Pour OVHcloud, la collaboration avec SambaNova est une démarche stratégique pour élargir son offre IA et répondre à la demande croissante d’inférence performante. Le service sera disponible avant la fin de l’année dans des régions en France. Une expansion ultérieure vers d’autres pays européens est prévue. Le service est proposé via un modèle de paiement à l’utilisation avec un engagement obligatoire.

Berlin et le quantique

En amont du sommet OVHcloud à Paris, l’acteur européen du cloud a annoncé l’ouverture d’une région cloud en Allemagne. Il s’agit de la première région de ce type de l’entreprise en Allemagne, et de la troisième en Europe après les lancements précédents à Paris et à Milan.

Avec la nouvelle région à Berlin, OVHcloud souhaite répondre à la demande croissante de souveraineté numérique, de sécurité et de résilience au sein du marché européen.

Une autre nouvelle en marge du sommet OVHcloud est le lancement de Quantum Platform. Cela vous donne un accès cloud aux systèmes quantiques européens. Le premier processeur disponible est le Pasqal Orion Beta QPU du français Pasqal. OVH souhaite proposer rapidement via le service les huit ordinateurs quantiques les plus avancés du moment. La plateforme doit aider les organisations à tester des cas d’utilisation sans leur propre infrastructure spécialisée.