Comment détecter les erreurs dans les LLM ? Utiliser un autre LLM

OpenAI lance un nouveau modèle linguistique qui aide les formateurs humains en IA à détecter les erreurs.

Les modèles linguistiques sont formés par des formateurs d’IA humains pour améliorer la qualité des réponses. Plus ces modèles linguistiques deviennent performants, plus ils dépassent les connaissances du cerveau humain et plus il est difficile pour les formateurs d’IA d’identifier les réponses erronées.

OpenAI a formé un nouveau modèle CriticGPT, basé sur GPT-4, pour aider les formateurs en IA à déboguer ChatGPT. « Nous avons constaté que les gens qui reçoivent l’aide de CriticGPT pour réviser le code de ChatGPT obtiennent de meilleurs résultats dans 60 % des cas que ceux qui n’ont pas reçu d’aide », a déclaré la start-up.

Formateurs humains en IA

L’OpenAI utilise des formateurs humains en IA pour former ses modèles linguistiques et détecter les erreurs de code de ChatGPT. Sous la devise « l’erreur est humaine », OpenAI a développé un nouveau modèle d’IA CriticGPT, qui devrait aider les formateurs humains s’ils ne détectent pas certaines erreurs. Le superlab d’OpenAI, soutenu par Microsoft, a publié jeudi un article intitulé « LLM Critics Help Catch LLM Bugs » expliquant la méthode en détail.

Combattre le feu par le feu

Dans la formation des modèles d’IA générative, tels que le GPT-4o récemment lancé, on utilise de grandes quantités de données et on les soumet à un processus de perfectionnement appelé « Reinforcement Learning from Human Feedback » (RLHF) (apprentissage par renforcement à partir du retour d’information humain). Les formateurs humains interagissent alors avec les LLM pour annoter leurs réponses à diverses questions. Ainsi, le modèle doit apprendre quelle réponse est préférée.

Étant donné que les connaissances de ces modèles linguistiques dépassent parfois les connaissances humaines, OpenAI n’a rien trouvé de mieux que de développer un autre modèle linguistique qui vérifiera le premier. Ce modèle CriticGPT assistera les formateurs humains et critiquera les réponses génératives du modèle linguistique.

Hallucinations

L’article montre que « les LLM détectent beaucoup plus de bogues saisis que les personnes qualifiées qui ont payé pour l’examen du code, et que les critiques de modèles sont préférées aux critiques humaines dans plus de 80 pour cent des cas ». Quant aux hallucinations, elles sont moins nombreuses quand les formateurs humains collaborent avec CriticGPT que quand CriticGPT répond seul, même si le taux d’erreur reste plus élevé que si un formateur humain avait répondu seul.

« Malheureusement, il n’est pas clair quel est le bon compromis entre les hallucinations et la détection des bogues pour un système RLHF global qui utilise la critique pour améliorer la performance du modèle », admet l’article.

Cookie	Duration	Description
__gads	1 year 24 days	Le cookie __gads, défini par Google, est stocké sous le domaine DoubleClick et permet de suivre le nombre de fois où les utilisateurs voient une publicité, de mesurer le succès de la campagne et de calculer ses revenus. Ce cookie ne peut être lu qu'à partir du domaine sur lequel il est installé et ne permet pas de suivre les données lors de la navigation sur d'autres sites.
_ga	2 years	Il s'agit d'un cookie de base de Google Analytics permettant d'identifier les utilisateurs de notre site Web. Par défaut, nous utilisons une version limitée de Google Analytics avant que les cookies ne soient acceptés. Les données y sont rendues anonymes et les fonctions de marketing sont désactivées.
_gid	1 day	Il s'agit d'un cookie de base de Google Analytics permettant d'identifier les utilisateurs de notre site Web. Par défaut, nous utilisons une version limitée de Google Analytics avant que les cookies ne soient acceptés. Les données y sont rendues anonymes et les fonctions de marketing sont désactivées.
cli_user_preference	1 year	Ce cookie garantit le bon fonctionnement de notre notification de cookies. Vos préférences sont stockées dans un cookie, afin que nous le sachions lors de votre prochaine visite.
CONSENT	2 years	YouTube place ce cookie via les vidéos YouTube intégrées et enregistre des données statistiques anonymes.
cookielawinfo*	1 year	Ce cookie garantit que notre notification de cookies fonctionne correctement. Vos préférences sont enregistrées dans un cookie afin que nous sachions quand vous nous rendrez visite la prochaine fois.
IDE	1 year 24 days	Les cookies Google DoubleClick IDE sont utilisés pour stocker des informations sur la façon dont l'utilisateur utilise le site web afin de lui présenter des annonces pertinentes et en fonction de son profil.
itdaily_lang	1 year	Ce cookie est nécessaire pour masquer la notification du pays. La notification du pays est affichée lorsque vous visitez le site web à partir d'un pays. C'est pourquoi nous proposons également une édition spécifique de ITdaily. Vous pouvez masquer cette notification grâce à ce cookie.
itdaily_theme	1 year	Ce cookie enregistre si vous voulez activer la version darkmode ou normale.
PHPSESSID	1 day	Ce cookie provient d'applications PHP standard. Le cookie est utilisé pour stocker et identifier une session d'utilisateur. Il s'agit d'un cookie de session qui est immédiatement supprimé lorsque vous fermez le navigateur.
test_cookie	15 minutes	Le test_cookie est défini par doubleclick.net et est utilisé pour déterminer si le navigateur de l'utilisateur prend en charge les cookies.
viewed_cookie_policy	1 year	Ce cookie garantit le bon fonctionnement de notre notification de cookies. Vos préférences sont enregistrées dans un cookie afin que nous puissions connaître votre prochaine visite.
wordpress_*	30 days	Wordpress utilise plusieurs cookies pour que le site web fonctionne correctement, par exemple pour permettre à l'équipe éditoriale de se connecter.
wp-*	1 day	Wordpress utilise plusieurs cookies pour que le site web fonctionne correctement, par exemple pour permettre à l'équipe éditoriale de se connecter.

Cookie	Duration	Description
_li_id.*	2 years	Ce cookie est utilisé par Leadinfo pour garder la trace des profils qui visitent ITdaily. Nous ne pouvons pas identifier les visiteurs individuels sur la base de ces statistiques.
_li_ses.*	30 minutes	Ce cookie est utilisé par Leadinfo pour garder la trace des profils qui visitent ITdaily. Nous ne pouvons pas identifier les visiteurs individuels sur la base de ces statistiques.
itdaily_views	1 hour	Ce cookie est utilisé par notre propre système pour suivre les utilisateurs sur le site web.

Cookie	Duration	Description
_li_id.*	2 years	Ce cookie est utilisé par Leadinfo pour garder la trace des profils qui visitent ITdaily. Nous ne pouvons pas identifier les visiteurs individuels sur la base de ces statistiques.
_li_ses.*	30 minutes	Ce cookie est utilisé par Leadinfo pour garder la trace des profils qui visitent ITdaily. Nous ne pouvons pas identifier les visiteurs individuels sur la base de ces statistiques.
VISITOR_INFO1_LIVE	5 months 27 days	Un cookie défini par YouTube pour mesurer la bande passante qui détermine si l'utilisateur obtient la nouvelle ou l'ancienne interface du lecteur.
YSC	session	Le cookie YSC est défini par YouTube et est utilisé pour suivre les vues des vidéos intégrées dans les pages YouTube.

Comment détecter les erreurs dans les LLM ? Utiliser un autre LLM

Formateurs humains en IA

Combattre le feu par le feu

Hallucinations

actualités liées

newsletter