La dernière conférence I/O de Google était une bouillie absolue de promesses en matière d’IA. L’entreprise a pris tant de tentatives avec de nouveaux modèles d’IA, s’exhiber de nouvelles capacités d’IA qui intègrent Gemini dans chaque produit ou service Google sous le soleil. Mais prenez suffisamment de photos, et la loi des moyennes dit à Au moins un d’entre eux fera mouche. Grâce à l’IA Gemini, la prochaine fonctionnalité « Demander des photos » pourrait vous faire plonger dans le labyrinthe des albums. dans Google Photos, c’est beaucoup plus facile.
Comme l’a détaillé Sundar Pichai, PDG d’Alphabet, lors de la présentation annuelle de son entreprise, la fonctionnalité utiliserait essentiellement l’IA pour rechercher dans vos énormes albums photo. pour vous. Vous pouvez utiliser des mots-clés pour essayer de découvrir ce que pourraient être des années d’images, de photos et de mèmes afin de trouver le un seul dont vous avez besoin. Google a affirmé qu’avec une seule invite, le modèle Gemini de Google examinerait vos photos avec plus de précision que d’habitude. requêtes d’aiguille dans une botte de foin.

L’IA Gemini dans Ask Photos peut interpréter les images et lire le texte qu’elles contiennent. Par exemple, si vous recherchez le permis de votre voiture une plaque parmi une multitude de photos de voitures insérées dans votre application Photos, l’IA aura une bien meilleure idée de quel est votre véhicule en fonction de la fréquence à laquelle la voiture apparaît dans vos albums et dans quel contexte. Pichai a déclaré que Ask Photos est si bon qu’il pourrait même interpréter des événements de la vie en fonction de vos photos, comme par exemple vous dire quand votre fille a appris à nager pour la première fois.
Dans un article de blog, Jeremy Selier, ingénieur chez Google Photos, a déclaré qu’il s’appuie sur la fonctionnalité de mots-clés IA existante qui est présente sur l’application depuis un certain temps maintenant. Au lieu de devoir trouver les bons mots-clés, il suffit de demander à votre téléphone toutes les photos prises dans un parc national. affichez toutes les photos pertinentes et donnez-vous un aperçu des parcs que vous avez visités.
L’IA devrait également être capable de comprendre les photos que vous avez prises au fil des ans. Dans un exemple, l’IA pourrait expliquer le différents thèmes des anniversaires d’un enfant réalisés au fil des années. Selier a écrit que l’IA sélectionne essentiellement les mots clés corrects pour vous avant de faire sa recherche à travers vos photos.
Bien que les démos aient l’air plutôt bonnes, il s’agit toujours d’IA, et l’IA a tendance à faire des erreurs. La société a déclaré que Ask Photos est “expérimental”, le surnom que Google donne à presque tous ses projets d’IA, quel que soit l’état dans lequel ils se trouvent. Les photos se souviendront des corrections que vous leur apporterez à l’avenir, mais cela ne veut pas dire qu’elles ne feront pas d’autres erreurs dans un autre invite.
La fonctionnalité devrait arriver « dans les mois à venir », bien que ce soit un délai plutôt vague qui correspond au reste des offres de Google. Annonces nébuleuses de l’IA lors des E/S de cette année. À tout le moins, Ask Photos semble bien plus utile qu’un des premiers générateurs vidéo d’IA. ou encore plus d’intégration de Gemini dans Google Workspace.