Reddit aurait signé un accord de 60 millions de dollars avec Google pour permettre à ses communautés en ligne d’être récupérées pour les données de formation à l’IA, selon Reuters Jeudi. Google passera au crible des millions de messages sur Reddit et formera un grand modèle de langage sur les fils de discussion de Reddit. L’accord sur le contenu a été initialement rapporté par Bloomberg mais n’a pas identifié la « grande entreprise d’IA » qui a reçu les données.
Reddit serait évaluer une introduction en bourse avec une valorisation de 5 milliards de dollars, bien qu’il n’ait rapporté que 800 millions de dollars de revenus l’année dernière. Reddit n’est pas rentable mais a une riche valorisation car ses communautés en ligne offrent un terrain d’entraînement idéal pour les modèles d’IA. Cependant, accorder une licence aux pensées et aux idées de votre base d’utilisateurs n’est pas toujours bien réciproque. les subreddits les plus populaires sont devenus sombres en signe de protestation l’année dernière après que les utilisateurs ont eu des problèmes avec l’entreprise facturer l’accès à son interface de programmation d’application (API), annoncé pour la première en avril 2023.
L’accord signalé par Reddit avec Google est exactement ce que la plateforme recherchait. Les grandes technologies ont soif de données, et cela s’est transformé les anciennes organisations de presse, les forums communautaires et même l’Université du Michigan en de simples fermes de contenu. Ces offres, bien que bouleversantes pour les utilisateurs, offrent à Reddit un chemin vers la rentabilité.
« Le corpus de données Reddit est vraiment précieux », a déclaré Steve Huffman, PDG de Reddit. Le New York Times en avril. « Mais nous n’avons pas besoin de donner gratuitement toute cette valeur à certaines des plus grandes entreprises du monde. .»
Mais lorsque Reddit a commencé à facturer l’accès à l’API, il n’a pas seulement facturé les grandes entreprises, il a également commencé à facturer les petits chercheurs indépendants. Ce changement a rendu plus difficile pour les modérateurs de Reddit de gérer leurs communautés, et certains ont fait valoir que cela rendait l’expérience pire pour les utilisateurs.Les 800 millions d’utilisateurs actifs mensuels de Reddit.
“Nous pensons que la longévité et le succès de cette plateforme reposent sur la préservation du riche écosystème qui s’est développé autour d’elle”, ont déclaré les modérateurs de Reddit. dans un lettre collective de juin dernier. « La perte potentielle de ces services due au changement de tarifications aurait un impact significatif notre capacité à modérer efficacement, donc affectant négativement l’expérience des utilisateurs de nos communautés.
Reddit n’a pas immédiatement répondu à la demande de commentaires de Gizmodo.
Apple était explorer des contrats d’IA de 50 millions de dollars avec le New York Times, Condé Nast et d’autres éditeurs d’actualités en décembre. Shutterstock est également autoriser son contenu créé par l’homme à OpenAI pour une formation sur ses modèles. Twitter, Instagram et YouTube sont également devenus de plus en plus précieux ces dernières années, car ils sont désormais considérés comme contenu des mines d’or.
La plateforme a également introduit des publicités ces dernières années et l’a fait impossible pour les utilisateurs de désactiver de voir le contenu des annonceurs en 2023À mesure que Reddit devient une entreprise publique, les utilisateurs craignent de plus en plus que la gestion nuise au forum communautaire florissant qu’elle a construit.
Il existe également une plus grande inquiétude quant à la manière dont les sociétés d’IA accordent des licences aux données. Les plateformes de contenu signent des accords de licence d’un million de dollars avec des sociétés d’IA, mais les véritables personnes qui ont créé ce contenu n’obtiennent rien. Pendant ce temps, l’IA menace pour remplacer les créateurs de contenu dans les secteurs de l’édition, du graphisme et du cinéma.