Reddit poursuit Perplexity pour vol de données destinées à l’entraînement d’IA

Reddit

Selon Reddit, Perplexity n’a pas de licence pour copier et utiliser les données pour ses modèles d’IA.

Reddit a intenté une action en justice aux États-Unis contre Perplexity, car selon Reddit, l’entreprise a illégalement copié des données de la plateforme pour entraîner son moteur de recherche IA. L’affaire a été déposée mercredi auprès d’un tribunal fédéral à New York.

Accusations de grattage de données à grande échelle

Dans la plainte, Reddit affirme que Perplexity et trois autres entreprises (Oxylabs, AWMProxy et SerpApi) ont contourné les mesures de sécurité de la plateforme pour accéder à des milliards de publications sur Reddit. Ces données auraient été utilisées pour entraîner le moteur de Perplexity.

Selon Reddit, les entreprises d’IA veulent fournir du contenu humain de haute qualité, ce qui les conduit à « blanchir des données ». Reddit affirme avoir accordé des licences à Google et OpenAI, entre autres, mais que Perplexity n’avait pas l’autorisation d’utiliser ses données.

Réaction des parties concernées

Perplexity qualifie son approche de « principielle et responsable » et déclare qu’elle se défendra devant le tribunal. SerpApi affirme être « en profond désaccord » avec les accusations, tandis qu’Oxylabs a déclaré être « choqué et déçu » que Reddit n’ait jamais pris contact pour en discuter.

Reddit affirme qu’après une lettre en 2024, Perplexity a multiplié par quarante le nombre de références à Reddit dans ses réponses. La plateforme demande une interdiction d’utilisation ultérieure de ses données et une compensation financière.

L’année dernière, Reddit a annoncé que même les moteurs de recherche ne pouvaient pas afficher gratuitement leur contenu comme résultat. Reddit a donc conclu un accord de soixante millions de dollars par an avec Google. Ainsi, Google obtient l’autorisation d’afficher les publications Reddit dans les résultats de recherche et d’entraîner les modèles Gemini sur ces publications.