Snapchat cherche à accélérer le temps de réponse de la création d’images IA génératives, avec une nouvelle approche qui présente un modèle plus rapide pour créer des visuels basés sur des requêtes textuelles.

Ce que je n’aurais pas pensé être un obstacle majeur à l’utilisation. La plupart des outils d’IA génératifs prennent actuellement environ 30 secondes pour générer de telles images, même sur des appareils mobiles. Mais Snap affirme que son nouveau système est capable de produire des visuels similaires en moins de deux secondes – ce qui, même s’il ne change pas la donne, est un développement intéressant dans le contexte plus large du processus d’IA générative.

Comme expliqué par Snap :

« SnapFusion réduit le temps d’exécution du modèle de la saisie de texte à la génération d’images sur mobile à moins de deux secondes, le temps le plus rapide publié à ce jour par la communauté universitaire. Snap Research a réalisé cette percée en optimisant l’architecture du réseau et le processus de débruitage, le rendant incroyablement efficace, tout en maintenant la qualité de l’image. Ainsi, il est désormais possible d’exécuter le modèle pour générer des images basées sur des invites textuelles et de récupérer des images claires et nettes en quelques secondes sur mobile plutôt qu’en minutes ou en heures, comme le présentent d’autres recherches.

Exemples d'IA Snapchat

Ce sont quelques exemples des visuels produits par le processus SnapFusion, qui ressemblent toujours beaucoup au même type d’images AI génératives que vous obtenez de n’importe quelle autre application (c’est-à-dire assez proches mais un peu bizarres). Mais ils ont été renvoyés à l’utilisateur beaucoup plus rapidement, ce qui, selon Snap, pourrait avoir de nombreux avantages.

Une expérience utilisateur améliorée est un facteur, mais Snap note également que le nouveau processus pourrait faciliter une meilleure confidentialité, en limitant le partage de données à des tiers, tout en réduisant les coûts de traitement pour les développeurs.

Bien que les recherches de Snap incluent quelques astérisques, y compris, notamment, que la majorité de ses expériences ont été menées sur un iPhone Pro 14, qui, selon les propres mots de Snap ‘a plus de puissance de calcul que de nombreux autres téléphones. En tant que tel, il est probablement douteux que quoi que ce soit de moins que cela réponde à ces critères de vitesse – mais ce sera toujours probablement plus rapide que les systèmes actuels.

Snap a fourni un aperçu complet du « débruitage », ainsi que beaucoup trop d’équations mathématiques, dans son article complet sur le processus, que vous pouvez télécharger ici.

C’est une expérience intéressante, qui pointe également vers l’avenir de l’IA générative, qui sera capable à terme de répondre aux signaux de l’utilisateur en temps réel, ce qui pourrait permettre toute une gamme de nouvelles options d’utilisation, comme la traduction en temps réel, la création de plus en plus réactive, et plus.

Erwan

Rédigé par

Erwan

Erwan, expert digital pour Coeur sur Paris, offre des insights pointus sur le marketing et les réseaux sociaux. Avec une plume vive et une analyse fine, il transforme les complexités du digital en conseils pratiques et tendances à suivre.