Google 在本次开发者大会 I/O 上宣布在 Google Photos 推出 AI 功能「Ask Photos」!这项功能由 Google 的 Gemini AI 模型所赋能,可以让使用者能够使用自然语言进行更直观、更智慧的照片搜寻。
过去虽然 Google Photos 已经支援搜寻特定的人、地点或事物,但在「Ask Photos」功能下寻找正确内容的过程将变得更加直观,不再需要繁琐的手动搜索,例如「找到我在每个国家公园拍摄的最佳照片」。AI 会结合光线、模糊程度、背景失真缺乏等各种资讯,来确定照片在特定集合中的「最佳」程度,并根据照片的地理位置或拍摄日期,只检索在国家公园拍摄的照片。
除了寻找特定主题或场合的最佳照片外,「Ask Photos」功能还允许使用者提出需要对照片内容有近乎人类般理解的问题。例如,一位家长可以询问 Google Photos 他们孩子最近四次生日派对的主题,AI 就能返回一个简单的答案,并附上美人鱼、公主和独角兽主题的相关照片和影片。
这种查询之所以成为可能,是因为 Google Photos 不仅理解使用者输入的关键字,还能理解「主题生日派对」等自然语言概念。它还可以利用 AI 的多模态能力来理解照片中的文字是否与查询相关。得力於每天有超过 60 亿张图像上传到Google Photos,Google 具备巨大的资料量得以训练模型。
另一项新功能允许使用者透过搜寻照片中的文字来寻找答案。例如,使用者可以拍下车牌号码或护照号码,然後在需要时请AI检索该资讯。
如果 AI 搞错了,使用者可以进行纠正,例如标记不是生日派对的照片,或是不想突出显示的度假照片,AI 会记住这些回应以不断改进。这也意味着使用者与 AI 互动的时间越长,AI 就会变得更加个人化。
Ask Photos 功能最初将在美国以英语提供,之後计画推广到更多市场。目前它只支持文字介面,类似於询问 AI 聊天机器人的问题。但随着时间的推移,它可能会与 Android 设备上运行的 Gemini 进行更深入整合。
核稿编辑:Sisley
快加入 INSIDE Google News 按下追踪,给你最新、最 IN 的科技新闻!