Les données de Reddit valent-elles réellement 60 millions de dollars par an ?

C’est apparemment le montant qu’une société de développement d’IA, encore inconnue, a payé pour obtenir un accès exclusif à l’ensemble complet de données de Reddit, ce qui verra ladite société d’IA intégrer les réponses des utilisateurs de Reddit dans son grand modèle de langage (LLM), en vue du système. fournir des réponses et des informations plus humaines et devenir un plus grand challenger dans la recherche en ligne.

Comme le rapporte Bloomberg, après avoir travaillé pour restreindre l’accès à ses données au cours de l’année dernière, afin d’empêcher les sociétés d’IA de profiter de son contenu, Reddit a désormais signé un contrat exclusif avec «une grande entreprise d’IA sans nom », qui verra cette entreprise intégrer les informations de Reddit dans ses modèles.

Ce qui représente un prix élevé, étant donné que le niveau supérieur d’accès à l’API de X (200 millions de publications par mois) coûte environ 2,5 millions de dollars par an.

Les données de Reddit pourraient-elles donc valoir bien plus que cela, et si c’est le cas, est-il alors logique que Reddit les fournisse sur une base exclusive ?

La valeur des données Reddit est qu’elles fournissent des informations réelles sur l’utilisation humaine, qui peuvent souvent avoir plus de valeur que les avis en ligne qui peuvent être manipulés et faussés par des réponses payantes. La situation est encore pire à l’ère de l’IA générative, certaines entreprises utilisant désormais des outils d’IA pour créer des avis à consonance humaine en ligne, afin d’améliorer leurs notes sur leurs produits.

En conséquence, de plus en plus de personnes se tournent vers Reddit pour obtenir des critiques honnêtes sur les produits et des informations sur les performances. Ils utilisent toujours Google, mais de plus en plus de personnes utilisent le Qualificateur « site:reddit.com » pour glaner des informations plus spécifiques sur les communautés Reddit.

Par exemple, si vous recherchez un nouveau sèche-cheveux, vous pouvez rechercher « meilleur sèche-cheveux » sur Google pour obtenir ceci :

Exemple Google

Ou vous pouvez ajouter « meilleur sèche-cheveux site:reddit.com » pour ceci :

Exemple Google

Les liens du forum Reddit se connectent aux expériences des personnes réelles et incluent des informations solides et fonctionnelles de ceux qui ont utilisé chaque appareil. Les réponses Reddit font également l’objet de votes positifs et négatifs, ce qui facilite la recherche de la meilleure réponse pour guider votre processus de recherche.

Des informations plus spécifiques et personnelles peuvent ajouter une valeur significative aux réponses fournies, et de nombreuses personnes ont constaté qu’il s’agit désormais d’un processus de découverte meilleur et plus précieux que de se fier aux résultats de Google en eux-mêmes.

Et désormais, une entreprise d’IA aura accès à toutes ces informations exclusivement pour elle-même.

Cela pourrait donner un coup de fouet à ses ambitions commerciales, en vue de faire des chatbots IA davantage un rival pour les comportements de recherche traditionnels. Déjà, de plus en plus de personnes se tournent vers les chatbots conversationnels pour la découverte en ligne, et ainsi, quel que soit le LLM pouvant accéder aux données Reddit, il disposera d’un trésor exclusif d’informations précieuses sur les consommateurs, qu’il pourra reconditionner dans ses réponses.

Par exemple, en utilisant la même invite de sèche-cheveux dans ChatGPT, le système me donne actuellement une liste de considérations techniques et de recommandations basées sur les meilleurs vendeurs. Mais avec des commentaires Reddit ajoutés, il pourrait également fournir un addendum plus personnalisé :

« Selon les utilisateurs, le meilleur sèche-cheveux pour cheveux bouclés est le sèche-cheveux Ella Bella Ionic, tandis que ceux qui ont les cheveux raides ont tendance à préférer le Dyson Supersonic. »

Le système pourrait alors fournir des réponses plus spécifiques en fonction de vos besoins, en obtenant ces informations auprès des communautés subreddit.

Il s’agit d’une valeur ajoutée importante, qui fera de l’entreprise qui obtient ces informations une option beaucoup plus viable en tant que facteur de recherche, même si le prix actuel de 60 millions de dollars par an est élevé et dépend également au moins dans une certaine mesure de la poursuite de la croissance de Reddit. afin d’en maximiser la valeur et l’utilité.

Et Reddit se développe. Reddit a ajouté 20 millions d’utilisateurs supplémentaires au cours des trois dernières années et continue de constater un fort engagement dans plus de 100 000 communautés actives. La société s’efforce de mettre en valeur sa valeur commerciale, en prévision d’une introduction en bourse prévue, qui pourrait avoir lieu le mois prochain, et cet accord sera désormais pris en compte dans la valorisation de la plateforme à l’avenir.

À certains égards, il est possible que Reddit limite ses opportunités en signant un contrat de données exclusif. Mais c’est pourquoi le prix est si élevé, et il sera intéressant de voir quel chatbot proposera bientôt des « informations exclusives sur Reddit » comme valeur ajoutée.

Je veux dire, il semble probable que ce sera OpenAI, avec le soutien de Microsoft, car il cherche à prendre la domination de la recherche Google. Avec l’essor des recherches conversationnelles, cela semble être un investissement logique, et en excluant une autre source de données du mélange, cela pourrait également conduire à une plus grande différenciation sur le marché.

Cela pourrait également indiquer des accords d’exclusivité similaires à l’avenir, alors que chaque entreprise tente de se différencier et de dominer avec ses outils de chatbot. Les chatbots IA actuels ont été capables de récupérer de grandes quantités de données sur le Web, ce qui signifie que leurs modèles initiaux seront tous relativement similaires, mais à l’avenir, à mesure que l’information évolue et que de nouvelles données sont nécessaires pour correspondre à l’intention de recherche, de nouvelles sources seront également nécessaires pour maintenir la pertinence et l’intérêt du public.

Meta prétend avoir un avantage à cet égard, car il dispose de toutes les informations publiées sur Facebook et Instagram, tandis qu’Elon Musk considérera xAI comme détenant une avance, car sa plate-forme est la principale application de discussion d’actualités en temps réel. .

Mais peut-être, compte tenu des tendances plus larges, Reddit Insight est-il en fait le véritable leader en termes d’affinement des requêtes de recherche.

Et peut-être que cela s’avérera plus important que la plupart ne le pensent.

Erwan

Rédigé par

Erwan

Erwan, expert digital pour Coeur sur Paris, offre des insights pointus sur le marketing et les réseaux sociaux. Avec une plume vive et une analyse fine, il transforme les complexités du digital en conseils pratiques et tendances à suivre.