谷歌周二正式发布其最新人工智能视频生成工具Veo 3,具备生成视频的同时同步嵌入音效的能力,成为对标OpenAI Sora的有力竞争者。
谷歌表示,Veo 3不仅可以基于文本和图像提示生成高质量的视频,还能自动加入包括人物对白、动物叫声等音效,实现更逼真的视听体验。
谷歌DeepMind产品副总裁Eli Collins表示:“从文字和图像提示,到真实世界物理效果与精准的唇形同步,Veo 3的表现都非常出色。”
这款工具目前已向美国用户开放,订阅谷歌全新Ultra会员计划(每月收费249.99美元)即可使用,该订阅计划主要面向AI重度爱好者。此外,Veo 3也将纳入谷歌面向企业客户的Vertex AI平台。
除了Veo 3外,谷歌还发布了多个与生成式AI相关的新产品,包括Imagen 4,升级版图像生成模型,能够根据用户提示生成更高质量、更真实的图片,以及Flow,一款电影制作辅助工具,用户只需描述场景、镜头和风格偏好,便可生成具有电影感的视频作品。该工具可通过Gemini、Whisk、Vertex AI及Workspace访问。
这些新产品的推出正值生成式AI在图像和视频创作领域的应用日益普及。OpenAI首席执行官奥特曼在3月曾透露,其旗下ChatGPT 4o的图像生成功能因过度受欢迎,甚至一度令计算芯片“过热”,公司不得不暂时限制该功能使用。
不过,谷歌在AI图像生成领域的历史并非一帆风顺。2024年,谷歌因Imagen 3模型生成带有历史错误的图像内容而遭遇广泛批评,随后被迫重新发布该工具。公司联合创始人Sergey Brin后来坦承,问题源于“测试不充分”。
除了发布Veo 3,谷歌还宣布对Veo 2进行更新,新增支持通过文字提示对视频中物体进行增删的功能。同时,谷歌还开放了其AI音乐生成模型Lyria 2,供YouTube Shorts创作者及Vertex AI企业客户使用。




- 两大车企宣布2027年实现固态电池量产装车,千亿级别市场望迎来产业化向上拐点
- 任正非展望"AI+核聚变",终极能源革命重构全球产业格局
- 文创IP板块集体领涨,政策和资本双轮驱动产业升级新周期
- 半年累计融资超10亿,专家称商业航天正迎来前所未有发展机遇
- 德国核聚变初创公司ProximaFusion获创纪录融资
- LABUBU爆火、泡泡玛特产能紧张,5000亿新兴市场展示“爆发力”
- 黄仁勋认为量子计算迎来拐点,AI推动量子计算发展!深挖量子计算机遇
- 重磅突破!黄仁勋宣布量子计算迎来历史拐点,全球科技巨头加速布局未来十年或迎百倍增长!
- 中国创新药爆发式增长:授权交易金额已达455亿美元,多个创新药品种迎来研发投入回报正循环!
- 我国将对汽车开展强制性产品认证,助力我国汽车出海