xAI a annoncé que son chatbot Grok faisait l'objet d'une mise à niveau, avec un raisonnement amélioré, en particulier sur les tâches liées aux mathématiques, une logique contextuelle étendue et des améliorations globales des performances.

xAI affirme que la dernière version de Grok le mettra au niveau des autres chatbots du marché, et les dépassera même sur plusieurs benchmarks.

Selon xAI :

« L'une des améliorations les plus notables de Grok-1.5 est ses performances dans les tâches de codage et liées aux mathématiques. Lors de nos tests, Grok-1.5 a obtenu un score de 50,6 % au test MATH et un score de 90 % au test GSM8K, deux tests mathématiques couvrant un large éventail de problèmes de compétition du primaire au lycée. De plus, il a obtenu un score de 74,1 % au benchmark HumanEval, qui évalue les capacités de génération de code et de résolution de problèmes.»

Grok devrait donc être en mesure de fournir de meilleures réponses, plus rapidement, sur diverses tâches. Mais en même temps, j'aimerais voir les données sur le nombre de personnes qui utilisent réellement Grok à l'heure actuelle.

Initialement publié en novembre, Grok est la réponse de X à ChatGPT, les utilisateurs pouvant poser des questions au bot et obtenir des réponses générées.

Chatbot Grok

De plus, vous pouvez mettre Grok en « Mode Fun » et obtenir des réponses plus impertinentes, ce qui, selon Elon et Cie, constitue une caractéristique différenciatrice.

Eh bien, cela et Grok n'est pas « réveillé », comme le sont tous les autres chatbots IA, selon Musk, tandis que Grok est également le seul chatbot alimenté par des publications en temps réel sur X, ce qui devrait lui donner un avantage dans le futur. contexte de la minute, etc.

Donc, théoriquement, Grok devrait être meilleur que les autres chatbots sur certaines tâches, mais là encore, Grok n'a pas la même puissance de calcul que ChatGPT ou Gemini ou les modèles alimentés par Meta's Llama.

Alors, Grok est-il bon ?

Eh bien, nous ne le savons pas vraiment, car jusqu’à présent, l’accès à Grok a été limité aux abonnés X Premium+, qui sont très peu nombreux.

X Premium compte globalement moins d'un million d'abonnés, et cela inclut toutes les personnes payant 8 $ et 3 $ par mois pour le forfaits réguliers et de base. Rares sont ceux qui paient 16 $ par mois pour le niveau supérieur Premium+, et en tant que tel, peu de personnes peuvent même accéder au bot pour partager leur expérience.

X cherche à changer cela en rendant Grok disponible à tous les abonnés Premium, tout en offrant également Premium aux utilisateurs très suivis.

Idéalement, cela lancerait le train à la mode de Grok et attirerait peut-être plus de personnes vers le chatbot. Mais une utilisation accrue mettra également en évidence davantage d’erreurs et de problèmes, ce qui pourrait également révéler des failles dans le système Grok.

Ce que nous avons vu avec tous les autres chatbots. ChatGPT a rencontré plusieurs problèmes importants qui ont nécessité des modifications de code, tandis que la tentative de Gemini de maximiser la diversité dans ses réponses a conduit à de nombreuses inexactitudes et problèmes. Les outils d'IA de Meta ont également été confrontés à des questions « controversées », et cela est dû en grande partie à un accès et une utilisation élargis.

Ce qui signifie probablement que Grok connaîtra la même chose, mais nous n'avons pas encore constaté le même niveau de problèmes avec l'outil car un nombre relativement restreint de personnes y ont accès.

Cela va bientôt changer et il sera intéressant de voir comment Grok et X gèrent ces problèmes avec l'outil.

Mais en même temps, Grok doit commencer à gagner de l’argent. xAI aurait dépensé des dizaines de millions de dollars pour acheter du matériel pour le projet, dans l'espoir de défier OpenAI, en particulier, dans la course à l'IA.

Parce qu'Elon est énervé qu'OpenAI ne veuille pas qu'il soit leur PDG. Après être devenu l'un des premiers investisseurs dans le projet, Elon a proposé de prendre la direction, ce qui a été rejeté par l'équipe OpenAI. OpenAI est alors devenu un projet à but lucratif, et Musk est contrarié qu'ils aient tous deux accepté son don initial à l'entreprise et ne l'aient jamais remboursé, tout en le rejetant.

Alors maintenant, il veut que xAI et Grok battent OpenAI. Mais pour ce faire, Grok doit également attirer des utilisateurs et des revenus.

Ce qui n'est pas encore le cas.

Ces nouvelles extensions vont-elles changer cela ?

xAI indique que Grok-1.5 sera disponible très prochainement.

Erwan

Rédigé par

Erwan

Erwan, expert digital pour Coeur sur Paris, offre des insights pointus sur le marketing et les réseaux sociaux. Avec une plume vive et une analyse fine, il transforme les complexités du digital en conseils pratiques et tendances à suivre.