电话: 邮箱:

博亚体育app官方网站 Google I/O杀疯了: 视频大模子超炸裂, 音频眼镜登台, Gemini继承一切

发布日期:2026-05-21 01:28 作者:admin 来源:未知 点击:198

博亚体育app官方网站 Google I/O杀疯了: 视频大模子超炸裂, 音频眼镜登台, Gemini继承一切

千呼万唤始出来,北京时期 2026 年 5 月 20 日凌晨,Google I/O 2026 终于开幕。因为 Google 提前用 The Android Show「分流」了 Android 17 的新功能,AI 终于成为了 Google I/O 2026 的主角。

但不同于其他 AI 企业,Google 同期掌捏 Gemini、YouTube、Google 网页搜索、Android 等多个不同的互联网生态进口。因此「怎样用 AI 为这些生态劳动『赋能』」,也成了这次 Google I/O 的重心。

视频模子 Omni和 3.5:新模子双王炸让 Google AI 更万能

澳门十大信誉网2026世界杯(中国)官网

Gemini 模子方面,Google 在 Google I/O 上崇敬发布了最新、最万能的 Gemini Omni。有多万能?用一句话来详细,即是「Gemini Omni 能从任何现象的输入,获取任何现象的输出」,且 Gemini Omni 还不错径直在生成经由中,以对话现象进行修改。

以 MV 生成为例,只有把音乐、视频、图片素材和对画面的约莫需求「喂」给 Gemini Omni,Gemini Omni 就能径直输出对应的短视频。在行动上,Google 还演示了一个相当夸张的 AIGC 案例:

在一张白纸上手绘一个圆圈,再加上一句翰墨形色,Gemini Omni 就能径直输出一个竣工的殊效视频。但这还没完,如若你对画面元素或立场不承诺,只有一句话就能在不变动其他画面元素的情况下,精确修改指定元素,比如「把玻璃建筑替换为肥皂泡」,后者以致还领有我方的物理碰撞完毕。

用 Google 我方的话来说,「Gemini Omni 就像是视频领域的 Nano Banana」。

凭据 Google 的先容,Google Omni Flash 模子即日起将在 Gemini App、Google Flow、YouTube Shorts 等平台上线,对应 API 将在之后开放。

除了「万能模子」Google Omni,Gemini 在 Google I/O 上也升级到了 Gemini 3.5 版块(Gemini 3.5 Flash)。和 Gemini 3.1 Pro 比拟,Gemini 3.5 Flash 在编程、施行环境智能体(Real-World Agentic)、大范畴器具调用等测试上齐有所晋升。

虽然了,关于 AI 模子而言,「有轻量级的 Flash 就势必有专科级的 Pro」——在行动上 Google 也预报 Gemini 3.5 Pro 将不才个月登场,但并未公布其他信息。

用一句话来总结,那即是「多快好省」四个字,Google 这次彻底作念到了。

Google Antigravity、Gemini Spark:智能体重构Google搜索

底层模子智力变强了,那基于 Gemini 的 AI Agent 当然也得到了升级。

拓荒者侧,Google 的 AI 拓荒环境 Antigravity 也用上了 Gemini 3.5 Flash。凭据 Google 先容,在 Gemini 3.5 Flash 的复古下,Antigravity 只用了 12 个小时就搭建了一个操作系统内核,而统共这个词拓荒经由的 AI API 资本还不到一千好意思元。

Google 以致用 Antigravity 和 Gemini 3.5 Flash 重构了 Google 搜索的交互界面,建议了全新的「生成式 UI」想法。普经常用 Google 或其他 AI 搜索引擎的一又友应该知说念,即使在搜索页面开启了 AI 模式(此处指的不是在 AI App 中以「筹办」竣事的常识库搜索),这个 AI 模式依旧是以对话框(ChatBox)的现象输出完毕。

关于一般的 AI 搜索来说,对话框的交互模式照实够用了。但如若用户问出的某个问题需要一些直不雅的演示,比如「陀飞轮是怎样使命的?」,文本框模式就排不上用场了。对此,Google 基于 Antigravity 的编程智力,打造了一个「自顺应、自生成」的 AI 搜索 UI。

疏忽来说,靠近复杂问题时 Google 搜索会用「Vibe Coding」的现象,径直写一个不错互动的前端网页,径直以互动的现象复兴用户的问题。

可惜的是,这项功能要比及 26 年夏令才会向用户开放。但好音讯是,这项功能属于 Google 搜索的更新,不需要用钱订阅 Gemini 也能使用。另外,Gemini App 自己的 UI 也得到了升级,与新的 Android 视觉元素愈加调节。

成绩于 Gemini 3.5 Flash 的多模态智力,Google 搜索的 AI 预测和多模态智力也得到了晋升。除了翰墨、以图搜图外,全新的 Google 搜索也不错径直输入视频或文档;也曾按照大数据智能排序的搜索保举,目下也升级成了基于 Gemini 3.5 Flash 的 AI 搜索补全。

除了前台可见的升级,Google 还全面晋升了搜索 Agent 的「后台智力」:全新的 搜索 Agent 不错在后台全天开动,按照用户的条目连续监控特定信息。比如小雷在睡眠前就不错让搜索 Agent 时刻热诚 OpenAI、Anthropic、Grok、Perplexity 等 AI 企业和 X 上的 AI 新闻,在出现破损错过的热门时径直邮件轰炸我的手机,让我爬起来写稿。

说到 Agent,Google 还在互动上崇敬发布了面向个东说念主用户的全新 Agent——Gemini Spark。和其他 AI Agent 一样,Gemini Spark 一样不错 24×7 全天继承用户的手机和浏览器。但不同于现时主流的托管类 Agent,Gemini Spark 会开动在特意的假造化环境中。

很显明,Gemini Spark 一样由 Gemini 3.5 Flash、Antigravity 驱动,当然也复古语音交互和后台反馈。而在外部联动上,Gemini Spark 不仅不错径直和 Google 生态的其他组件(Google Docs、Google Calendar、Gmail 等)径直联动,还不错通过 MCP 条约与外部 App 互联互通,竣事更全面的任务托管。

Google 并未在行动中公布 Gemini Spark 的平台适配情况,雷科技展望 Gemini Spark 会以 Gemini App(iOS)、Google 搜索组件(Android)的现象登陆手机。

而在 AI Agent 开动时(无论前后台),新加入的 Android Halo 功能会在 Android 手机屏幕左上角常驻一个 Agent 景况符号,浅近用户随时跳转到 Agent 界面,嗅觉就和目下手机的「录像头领导」「麦克风领导」差未几。

在雷科技看来,Android Halo 的出现,博亚(中国)体育app其实也从另一个角度强调了 Agent 的热切性:尽管从工夫上讲,Gemini Spark 仅仅一个「软件功能」,但其地位早已和录像头和麦克风一样,是手机不行或缺的中枢构成。

电脑方面,Google 提到 Gemini Spark 将在 26 年夏令登陆 Chrome 浏览器。

但不同于豆包等部分付费的国内 AI Agent,Gemini Spark 为全订阅功能,下周会开放给 Google AI Ultra 订阅用户。

值得一提的是,为了分辩企业用户和高用量个东说念主用户,Google 在蓝本的 AI Pro(每月 20 好意思元)、AI Ultra(每月 250 好意思元、限时降价至每月 200 好意思元)之间,额外加入了一个「芳华版」AI Ultra 品级(每月 100 好意思元)。

看得出,即使是「财大气粗」的 Google ,也难以靠免费模式保管这种全面 AI 带来的稠密算力资本。说到底,AI 的格外是算力,算力的格外是硬件,而硬件的格外是钱。在 AI 期间,互联网巨头还是难以靠硬件销售和劳动订阅来保管 AI 的资本了。

夸张点说,跟着 AI Agent 的智力进一步彭胀,付费 AI 劳动很有可能会变得跟手机套餐一样,成为咱们「刚性亏欠」的一部分。

音频眼镜初度登台,Gemini 硬件生态日渐完善

在客岁,Google 展示了带显露功能的 AI 眼镜。在本年的 google I/O 上,Google 也带来了「音频版」智能眼镜的预览。最初,尽管名字叫「音频智能眼镜」,但这类 Gemini 眼镜并不是界环那种纯音频眼镜,而是搭载录像头、领有 AI 视觉和多模态输入智力的音频眼镜。

由于眼镜要 26 年秋季才发布(高概率是配合高通骁龙峰会上的新芯片),是以 Google 并未在 Google I/O 上公布分量、传感器型号、续航等家具具体信息,只展示了家具外不雅和约莫的功能。

野心方面,Google I/O 上提到了三星与 Gentle Monster、Warby Parker 两大知名眼镜品牌合营打造的智能眼镜。功能上,两款眼镜和现存的 AR1 智能眼镜访佛,不错用语音或右边镜腿的触控板叫醒 Gemini。

成绩于 Gemini 底层模子和 Spark 智能体的智力,Gemini 眼镜不错全自动把用户的语音指示拆解成 Agent 算作,并在用户的手机上后台践诺。用户不错在眼镜上用语音条目 Gemini「买一杯前次点的咖啡」;手机上的 Gemini 就不错自动灵通咖啡 App、自动添加商品到购物车,并在用户语音证据(应该和国内 AI 眼镜一样接纳声纹考据工夫)后径直下单。

值得一提的是,Google 还提到 Gemini AI 音频眼镜将复古 Android 和 iOS 两个平台。不错确定的是,在 iOS 极为严格的 App 沙盒机制下,Gemini 音频眼镜的智力和 Android 平台比拟势必大打扣头。

为了拓展 Gemini 的智力鸿沟,Google 也把我方的办公套件(Google Workspace)全面 AI 化:用户不错用语调子用 Gemini 查找邮件信息(Gmail Live)、写稿(Docs Live)以致是生成图像(Google Pics)。

联接此前 Android 17 选题里提到的高端 Googlebook,谷歌本年是在不遗余力地把 Gemini 塞进我方能掌控的每一个生态硬件里。

Google I/O 的主题演讲的到这里就告一段落了,看到这里,可能有东说念主会以为这次 Google I/O 只不外是 Google 在 AI 大战落后后的「画饼」行动。但在雷科技看来,Google I/O 2026 主题演讲提到的本色,其实意味着谷歌终于摸到了 AI 期间的正确门票。

比如针对「AI 颖慧什么」这个问题,Google 径直对我方的「发财业务」开刀,用生成式 UI 改换了 AIGC「回合制」「单向交互」的设定。这种从单向到双向的振荡也出目下了 Gemini 智能硬件中。往时很长一段时期里,AI 硬件赛说念齐莫得出现着实的「双向 AI 缔造」:硬件是硬件,AI 是 AI,两者割裂极为严重。

而这一次,Gemini 3.5 Flash 的多模态智力,着实让音频眼镜等缔造成为了 Gemini 的「物理器官」,再加上上周发布的 Googlebook,Gemini 终于领有了主动感知全国、主动输出完毕的智力。

更热切的是,Gemini 正诳骗其在 Android 系统中的「特权」,构筑一齐其他厂商无法跨越的护城河。当国际的 Anthropic、国内的各样大模子智能体还在沙盒机制的旯旮试探,用 MCP 条约用功地搞跨 App 协同操作时,Gemini 还是在 Android 底层竣事了流通无阻的原生互通。

还谨记咱们来源是说过的「Google 同期掌捏 Gemini、YouTube、Google 网页搜索、Android 等多个不同的互联网生态进口」吗,在 Google I/O 2026 上,这些四面「着花」的生态进口,终于等来了「完毕」的季节。

但话又说转头,Gemini 高度依靠 Google 生态,这对 OpenAI、Grok 来说不详是个挑战;但对国内 AI 企业来说,这亦然 Gemini 留给他们的机遇。

毫无疑问,Gemini 在国际再怎样大杀四方、原生互通,这套全家桶生态在国内依旧「水土不平」。但这套「多模态输入输出 + 出奇系统 + 全天候托管 Agent」的业务逻辑,却给国内 AI 企业指明了发展的说念路:

国际有谷歌在原生底层大刀阔斧地拔除沙盒终端,国内厂商一样能在定制安卓系统里搞起我方的「寂寥王国」。

更热切的是,中国品牌在智能体原土化落地上的卷度,以致比原生安卓还要激进,还更接地气。在 Google I/O 2026 上,Google 亮出了 Gemini 的底牌,接下来就看国内 AI 巨头们和手机品牌们怎样强强联手博亚体育app官方网站,用合营「破局」了。

相关标签: