DeepSeek : « Un nouveau modèle distillé peut fonctionner sur une seule carte graphique »

Logo DeepSeek smartphone

DeepSeek a publié une version plus petite de son modèle R1 qui ne nécessite qu’une seule carte graphique pour fonctionner.

La nouvelle version distillée du modèle R1, nommée DeepSeek-R1-0528-Qwen3-8B, obtient, selon l’entreprise chinoise d’IA, de meilleurs résultats que des modèles comparables sur certains benchmarks. Elle est construite sur la base du modèle Qwen3-8B d’Alibaba.

Moins de puissance de calcul

DeepSeek affirme que ce modèle obtient de meilleurs résultats que Gemini 2.5 et Phi-4-Reasoning sur des benchmarks mathématiques. Les modèles plus petits sont souvent moins capables que les versions ‘normales’, mais ils nécessitent également beaucoup moins de puissance de calcul. Selon la plateforme cloud NodeShift, ce modèle ne nécessite qu’une seule carte graphique avec entre 40 Go et 80 Go de RAM pour fonctionner. En comparaison, le modèle R1 normal nécessite environ 80 cartes graphiques.

Le modèle a été entraîné avec du texte généré par le modèle R1 récemment mis à jour. DeepSeek affirme que ce modèle a un taux d’hallucination plus faible, un support étendu pour les appels de fonction et une meilleure expérience de codage.

Tout le monde n’est pas fan de la technologie d’IA chinoise. Tant le gouvernement belge qu’américain interdisent à leur personnel d’utiliser DeepSeek, et l’application serait même bannie des boutiques d’applications de Google et Apple aux États-Unis. L’entreprise ne serait pas non plus très regardante en matière de sécurité et de confidentialité.

lire aussi

Nouveau modèle DeepSeek capable de résoudre des preuves mathématiques complexes