Google mettra Gemini et Agentspace à disposition dans des environnements sur site à partir du troisième trimestre. Cela permettra l’exécution locale des modèles et applications Gemini sans devoir partager de données avec le cloud.
Gemini est la vedette du Google Cloud Next à Las Vegas. Google annonce de nouvelles additions à son arsenal d’IA, incluant Gemini Flash 2.5, une version plus rentable de Gemini 2.5 Pro qui avait déjà vu le jour avant la conférence.
Tous les modèles Gemini avaient en commun d’être exclusivement disponibles via les serveurs cloud de Google, mais cela va changer. Google offrira bientôt la possibilité d’exécuter Gemini et les applications qui en dépendent dans des environnements sur site.
Gemini sur site
Cela ne signifie pas que Google abandonne complètement Gemini. Google rend possible la version sur site de Gemini via sa plateforme Distributed Cloud. Il s’agit d’une solution cloud gérée par Google pour les environnements sur site et en périphérie, disponible dans des configurations connectées et isolées (air-gapped).
Nvidia joue un rôle prépondérant. Gemini fonctionne sur des systèmes Blackwell, tels que le DGX B200 et le HGX B200, qui peuvent être commandés via Google. Grâce à cette collaboration, les organisations peuvent déployer l’IA générative sans que les données ne quittent leur propre infrastructure. Selon Google, la solution offre un support pour le traitement multimodal de texte, d’images, d’audio et de vidéo, ainsi que la prise en charge de contextes de millions de tokens et de plus de cent langues.
Via l’API Gemini, les entreprises peuvent déployer l’IA générative sans se soucier de la gestion de l’infrastructure ou de la maintenance des modèles. De plus, elles peuvent intégrer leurs propres données via la Génération Augmentée par Récupération (RAG), par exemple pour résumer des documents ou effectuer une analyse de sentiment sur les retours clients.
lire aussi
Qu’est-ce que le RAG ou la génération augmentée par récupération ?
Agentspace sur site
Avec Gemini, Agentspace sera également disponible dans le cloud distribué à partir du troisième trimestre. Les entreprises pourront également utiliser Agentspace sur des données qu’elles préfèrent garder sur site et poser des questions via l’interface de chat. Agentspace prend en charge les requêtes multimodales sur des données dans divers formats, tels que le texte, l’image, le PDF ou la vidéo. L’outil tient compte des droits d’accès, ce qui est crucial pour la conformité dans les secteurs sensibles.
Google associe Agentspace à Vertex AI afin que les entreprises puissent également construire leurs propres agents d’IA. Grâce à des connecteurs prêts à l’emploi, vous pouvez relier Agentspace et vos agents d’IA à d’autres systèmes que vous utilisez, tels que SharePoint et ServiceNow.
Local ou dans le cloud
Avec cette annonce, Google Cloud suit un changement du marché vers des solutions d’IA fonctionnant plus localement. Les entreprises montrent leur volonté de travailler avec l’IA, mais ne sont pas toujours enthousiastes à l’idée d’envoyer des données internes vers le cloud. Bien que le cloud puisse offrir des avantages en termes d’évolutivité et de rapidité, il n’est pas l’option privilégiée en matière de confidentialité.
Les fabricants de PC comme HP et Lenovo y répondent avec des assistants IA maison qui fonctionnent sur votre PC, éliminant ainsi le besoin d’un abonnement cloud, et Microsoft recherche également des moyens de faire fonctionner Copilot localement. Bien que Google préférerait que vous utilisiez Gemini depuis ses serveurs cloud, il se voit contraint de suivre les tendances du marché.