首页 > 今日汽车 > 今日汽车 > 音效师狂喜!谷歌推出首个AI视频自动配音工具,一个人干了后期活

音效师狂喜!谷歌推出首个AI视频自动配音工具,一个人干了后期活

发布时间:2024-06-19 22:58:50来源: 15210273549

提供1000+款AI效率工具丨AIEVA.CN丨欢迎访问

AI奇点网-AI工具特刊丨6月19日


谷歌发布新一代AI视频自动配音工具,AI视频开启「有声时代」!

6月17日,谷歌人工智能团队DeepMind发布了一个名为V2A(Video-to-Audio)的AI架构系统,顾名思义即“视频转音频”,能根据画面内容或者手动输入的提示词直接为视频配音。

该模型最大的功能在于,可为任何视频自动创建合适的音轨BGM,在实践中取得了十分有效的进展,可以大大降低视频配音的制作成本。


当前Sora、Pika、可灵以及Runway等视频模型已经能输出逼真的短片,但它们均输出的是默片。

谷歌V2A系统的特点,便是V2A能依靠自身的多模态视觉能力理解视频当中的信息。V2A能看懂画面,知道画面里正在发生什么,应该出现什么声音。

举个例子,比如输入一则主题为「在黑暗中行走」的无声视频,添加“电影、恐怖片、音乐、紧张、混凝土上的脚步声”等文本提示后,AI模型就能根据提示词生成恐怖片风格的背景音效,十分逼真。

 

00:00 / 00:12


脚步声基本吻合人物走动的节奏,随着画面的切换,脚步声也随之消失,毛骨悚然的紧张感拉满。

为了能够贴近Sora热点,谷歌V2A的开发团队使用了不少Sora生成的视频片段作为输入范例。

 

00:00 / 00:08


比如上边这段Sora生成的水母漂荡影像,营造出了负压十足的深海水压感。

下方这则短片也是Sora的样片,经由V2A生成的音乐配乐后的视频颇有西部大片的感觉。

今日汽车更多>>

五菱之光EV纯电多功能车预售在即,续航201公里 江铃易至EV3 PLUS掀背车1月13日上市,升级外观内饰 小米YU7 SUV预计6月上市,雷军推荐特斯拉Model Y 2024年乘用车零售超2289万辆,2025年压力很大? 一汽-大众20个月内推19款新车,明年增程插混车型亮相 跌破百万辆,本田在华还在寻求机会? 涨价3600元23.55万元起!新款特斯拉Model 3后驱版上市 吉利Supervan将登陆澳大利亚,电动货车市场迎新机遇 12月销量突破1万辆,搭载华为乾崑智驾的全新岚图梦想家实力如何 比亚迪海豹05DM-i开启预售,8.98万元起,搭载第五代DM混动技术 这车市疯了吧?紧凑型SUV补贴后6.49万起售,1.5T可爆发204马力 哈弗H7“重生”,动力换装插混系统,设计大变样 细分市场销量第二,丰田赛那补贴下来27.6万起,香不香? 全新大众途昂Pro曝光!外观年轻化,车长超5米1,能成爆款? 卖不动非要强推纯电车,合资品牌干嘛自讨苦吃? 全新一代卡罗拉曝光,造型更运动,续航或达2100km,值得期待? 汽车连接器模具脱模设计关乎生产质量的核心环节 新能源汽车充电桩安全升级:光电传感器与防倾倒开关守护充电安全 车企2025年销量目标:新势力普遍翻倍,传统车企稳中求升 “真诚永远是必杀技”保时捷女销冠连续两年卖出170辆 首个百万销量中国汽车品牌,比亚迪加速布局海外市场拓展步伐 2024年上汽通用销量利润双回暖,未来将着眼智电技术升级迎接挑战 起亚万辆汽车澳洲紧急召回,CV EV6和Sorento车型中招! 曝广汽集团重大调整! 2024Co客大会惊喜不断 安聪慧“官宣”全新大型高端插混SUV 2025款高尔夫GTI、领克03+、雪佛兰星迈罗,性能出众的车型推荐 高性价比,三款适合当网约车的车型推荐 吉利银河星舰7 EM-i用车成本分析,每月花费975元 新款奔驰AMG CLA 35用车成本分析 月均花费2342元 传祺M6 PRO、吉利嘉际、东风菱智,10万左右就能买的MPV推荐