谷歌 DeepMind 公布为无声视频配音 AI 模型

虚沩2024-06-21  104

导读:卡饭网 6 月 21日消息,据DeepMind新闻稿透露,DeepMind最新研发出一项“video-to-audio”AI模型技术,可为无声视频量身打造背景音乐。 目前该AI模型仍存局限,需开发者以提示词预先“描绘”视频可能的声响,尚不能…

卡饭网 6 月 21 日消息,据DeepMind新闻稿透露,DeepMind最新研发出一项“video-to-audio”AI模型技术,可为无声视频量身打造背景音乐。

目前该AI模型仍存局限,需开发者以提示词预先“描绘”视频可能的声响,尚不能直接依据视频画面添加具体音效。


谷歌 DeepMind 公布为无声视频配音 AI 模型

据悉,模型会先将用户输入的视频进行拆解,再结合用户提供的文字提示,通过扩散模型反复运算,最终生成与视频画面相协调的背景声音。

例如,输入一段“黑暗中行走”的无声视频,并添加“电影、恐怖片、紧张氛围、脚步声”等提示词,模型便能生成符合恐怖风格的背景音效。

DeepMind 同时表示,该“video-to-audio”模型可以为任何视频生成无限数量的音轨,还能够通过提示词内容判断生成的音频“正向性”或“反向性”,从而令生成的声音更贴近某些特定场景。

展开全文

为您推荐


本文地址: https://life0731.com/read-415500.html
免责声明:本文仅代表作者个人观点,与长沙生活网(本网)无关。其原创性以及文中陈述文字和内容未经本站证实,对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺,请读者仅作参考,并请自行核实相关内容。
    本网站有部分内容均转载自其它媒体,转载目的在于传递更多信息,并不代表长沙生活网(本网)赞同其观点和对其真实性负责,若因作品内容、知识产权、版权和其他问题,请及时提供相关证明等材料并与我们联系,本网站将在规定时间内给予删除等相关处理.


相关阅读

最新回复(0)