开云体育谷歌认真发布Gemini Omni模子-开云官网kaiyun切尔西赞助商 (中国)官方网站 登录入口
发布日期:2026-05-24 06:29 点击次数:164

快科技5月20日音尘,在Google I/O 2026上,谷歌认真发布Gemini Omni模子。该模子接济文本、图像、音频、视频动作输入,竣事跨模态生成与裁剪。
其中在音频方面,当今该模子初期仅接济语音输入,但Google示意异日将很快膨大更多类型的音频输入智力。
首发产物Gemini Omni Flash已在Gemini诈欺上线,后续将向企业客户灵通API。
该模子中枢卖点在于深度视频裁剪智力。用户通过当然谈话教导即可对生成本色握续迭代,包括添加或删除对象、切换录像机角度、修改环境与作风。
收成于模子对物理法令的领路以及对历史、科学、文化学问的整合,生成的视频在变装、场景及视觉逻辑上高度连贯,以致能估量后续情节。用户亦可创建个东谈主数字分身,并将其植入视频中。
谷歌在安全界限同步布局,通盘通过Omni生成的视频均会自动镶嵌SynthID数字水印,接济通过Google搜索及Chrome考据。
Gemini Omni Flash 现已面向领有 Google AI Plus/Pro/Ultra 订阅的用户在 Gemini 诈欺和 Google Flow 中推出。此外,它还免费向但愿混剪 YouTube Shorts 的用户以及 YouTube Create 诈欺用户推出。
Google DeepMind负责东谈主哈萨比斯示意,该模子正鼓舞AI从单纯的任务实验向通用东谈主工智能(AGI)迈进。
开云体育
