艾赫巴里通讯社 | 2026-05-12T14:30:00Z
在备受瞩目的I/O 2026开发者大会上,谷歌(Google)隆重发布了一系列人工智能领域的重磅更新,其中Gemini系列模型成为绝对的焦点。公司正式推出了Gemini 3.5模型家族,包括速度极快的Gemini 3.5 Flash,据称其每秒输出令牌(TPS)的速度是现有前沿模型的四倍。而更为强大的Gemini 3.5 Pro版本则计划于下月上线。Gemini 3.5 Flash现已成为Gemini应用程序及谷歌搜索AI模式的默认引擎。
Gemini Omni:迈向通用人工智能的关键一步
除了Gemini 3.5系列,谷歌还发布了全新的Gemini Omni“世界模型”。谷歌DeepMind的CEOデミス・ハサビス(Demis Hassabis)将其描述为迈向通用人工智能(AGI)的关键一步。与传统的文本到视频AI模型不同,Gemini Omni在输入和输出端均支持多模态交互,用户可以使用文本、音频、图像和视频作为提示输入,模型将生成科学上准确且逼真的内容。Gemini Omni Flash即日起面向Google AI Plus、Pro和Ultra付费订阅用户在Gemini应用和Google Flow中推出。本周晚些时候,它还将免费登陆YouTube Shorts和YouTube Create应用。
另请阅读
Gemini Spark:您的专属AI代理
此次发布中最具野心的产品无疑是Gemini Spark,它被定位为“您的个人AI代理”。Spark深度整合了谷歌的各项产品,并计划通过MCP平台与Adobe、Dropbox、Uber等超过30家第三方工具实现互联。作为AI代理,Spark能够检索您的电子邮件和文档,为您的上司撰写更新摘要,并且完全在云端运行,无需任何本地硬件支持。Gemini Spark将于下周在美国率先向Google AI Ultra订阅用户推出,集成在Gmail和Chat应用中。此外,谷歌宣布将其Ultra订阅的起售价下调至每月200美元,并新增了一个99美元/月的低价套餐。
Gemini应用迎来全新设计语言
最后,Gemini应用程序将采用一套名为“Neural Expressive”的全新设计语言。此次更新带来了更流畅的动画效果、触觉反馈以及更加鲜艳的色彩。新设计还将Gemini Live语音体验无缝集成到核心用户界面中,用户无需再进行繁琐的切换。谷歌表示,这项更新将面向Gemini的桌面版、Android版和iOS版应用进行全球推送。