Oui, je ne suis pas sûr des différents noms donnés par Google à ses produits d’IA générative.
Clarifier:
- Barde est le chatbot génératif d’IA de Google, un peu comme ChatGPT
- Gémeaux est le groupe LLM (Large Language Model) de Google, comme GPT
- Image est le système de génération d’images IA de Google
Tout est clair?
D’accord, alors ce paragraphe de Google devrait maintenant avoir plus de sens.
« En décembre dernier, nous avons apporté Gemini Pro en Barde en anglais, donnant à Bard des capacités de compréhension, de raisonnement, de synthèse et de codage plus avancées. Aujourd’hui, Gemini Pro dans Bard sera disponible en plus de 40 langues et plus de 230 pays et territoiresafin que davantage de personnes puissent collaborer avec cette version plus rapide et plus performante de Bard.»
Je suppose que pour la plupart des gens, sans le contexte précédent, l’explication ci-dessus aurait été quelque peu déroutante, mais fondamentalement, Google rend désormais son chatbot Bard plus puissant, avec des modèles d’IA avancés alimentant ses réponses, tout en ajoutant également une capacité de génération d’images. au sein de Bard lui-même, alimenté par Imagen.

Google a adopté une approche prudente en matière de développement de l’IA générative et a critiqué les autres pour avoir poussé trop fort, trop vite, avec leurs outils d’IA générative. Certains ont considéré cela comme un préjugé anticoncurrentiel et Google protège simplement son territoire, alors que de plus en plus de personnes se tournent vers des outils comme ChatGPT pour les requêtes de recherche. Mais le point de vue de Google est que l’IA générative doit être déployée lentement afin d’atténuer les abus, ce qui a déjà conduit à divers problèmes d’un point de vue réglementaire.
Mais aujourd’hui, Google franchit une nouvelle étape avec plusieurs de ses outils d’IA générative, avec Bard, comme indiqué, améliorant la réflexion système et la création d’images, Google Maps bénéficiant désormais de nouvelles requêtes conversationnelles, alimentées par l’IA, pour faciliter la découverte de lieux, et Imagen 2. , la prochaine étape de son système de création visuelle, également déployée au sein de ses outils de génération d’images.

Comme expliqué par Google :
« Imagen 2 a été formé sur des appariements image-description de meilleure qualité et génère des images plus détaillées qui sont mieux alignées sur la sémantique des invites linguistiques des utilisateurs. C’est plus précis que notre système précédent au traitement des détails, et il est plus capable de capturer les nuances – fournissant des images plus photoréalistes dans une gamme de styles et de cas d’utilisation.»
Cela offrira davantage de possibilités de créer de meilleurs visuels au sein des systèmes de Google, qui seront également créés avec diverses protections en place, afin de limiter «des résultats problématiques comme des contenus violents, offensants ou sexuellement explicites ».
« Toutes les images générées avec Imagen 2 dans nos produits grand public seront marquées par SynthID, un outil développé par Google DeepMind, qui ajoute un filigrane numérique directement dans les pixels des images que nous générons. Les filigranes SynthID sont imperceptibles à l’œil humain mais détectables pour l’identification.
Compte tenu de la récente controverse entourant les images de Taylor Swift générées par l’IA, il s’agit d’une mesure importante et l’une des nombreuses préoccupations que Google a soulevées à plusieurs reprises lors du déploiement rapide des outils d’IA, car nous ne disposons pas encore de tous les systèmes et processus nécessaires. endroit pour se protéger pleinement contre ce type d’utilisation abusive.
En ce sens, les générations d’IA de Google pourraient être plus sûres et plus fiables à cet égard, même si les outils d’OpenAI ont clairement pris la première place en tant qu’outils d’IA de choix, du moins dans cette première poussée.
Néanmoins, Google fait évoluer ses propres offres, et celles-ci pourraient bientôt devenir encore plus précieuses, en fonction de la manière dont ses systèmes continuent de se développer. Il existe désormais un large éventail d’options pour la recherche et la création d’IA générative, mais à terme, le marché s’affinera et les outils les plus performants apparaîtront, prenant une plus grande part de marché.
Google espère que son approche plus prudente et mesurée l’emportera à long terme, tout en disposant de plus de ressources et de capacités que la plupart de ses concurrents.
Et si Google parvient à l’emporter, il peut également protéger son activité principale de recherche, en veillant à ce que l’IA conversationnelle ne ronge pas complètement son marché. Du moins pas rapidement, ce qui incite davantage Google à maximiser ses outils d’IA au fil du temps.
Quoi qu’il en soit, quelques outils intéressants à expérimenter, qui pourraient mieux s’adapter à votre processus d’utilisation.
Google indique que Gemini Pro est désormais disponible dans Bard, tandis qu’Imagen 2 est désormais disponible sur Bard, ImageFX, SGE et Vertex AI. Les guides d’IA générative de Google dans Maps commenceront à être testés auprès des utilisateurs américains à partir de cette semaine.