Un petit modèle d’IA surpasse les grands LLM dans des tâches complexes

Un petit modèle d’IA surpasse les grands LLM dans des tâches complexes

Sapient Intelligence présente un modèle d’IA qui raisonne plus efficacement que les grands modèles de langage et qui fonctionne de manière similaire au cerveau humain.

La startup singapourienne Sapient Intelligence a développé une nouvelle architecture d’IA qui surpasse les grands modèles de langage (LLM) dans les tâches de raisonnement, avec moins de puissance de calcul et de données. Le Hierarchical Reasoning Model (HRM) s’inspire du fonctionnement du cerveau humain et de son traitement des détails.

Pas besoin de chaîne de pensée

Les LLM classiques utilisent la « chaîne de pensée » pour générer du texte étape par étape. Selon le nouvel article de l’entreprise, cette approche est lente, gourmande en données et sujette aux erreurs. En revanche, HRM raisonne comme les humains sans avoir à verbaliser ses pensées.

HRM fonctionne via deux modules collaboratifs : un module H lent planifie stratégiquement, tandis qu’un module L rapide résout les problèmes. Cela empêche le modèle de se bloquer prématurément ou de rencontrer des problèmes d’apprentissage.

Moins de données, plus de résultats

Sur des benchmarks comme les Sudoku extrêmement difficiles et l’ARC-AGI, HRM a obtenu de meilleurs résultats que les modèles plus grands d’OpenAI et d’Anthropic. Le modèle n’avait besoin que de 1 000 exemples d’entraînement par tâche, rapporte VentureBeat.

Selon le PDG Guan Wang, HRM offre des avantages particuliers dans des secteurs comme la robotique et la santé, ainsi que dans des domaines scientifiques. Pour les problèmes de décision complexes, HRM est selon lui « 100 fois plus rapide et beaucoup moins coûteux » que les LLM classiques.

Dans ces scénarios, HRM ne se contente pas de résoudre les problèmes, il apprend aussi à mieux les résoudre. « Dans nos expériences de Sudoku de niveau maître, HRM nécessite de moins en moins d’étapes au fur et à mesure que l’entraînement progresse. C’est comparable à un débutant qui devient expert », explique Wang.