鱼C论坛

 找回密码
 立即注册
查看: 72|回复: 2

[最新资讯] AI懂配音了!「Draw an Audio」理解视频内容,生成与画面内容匹配的音频

[复制链接]
发表于 前天 11:00 | 显示全部楼层 |阅读模式

马上注册,结交更多好友,享用更多功能^_^

您需要 登录 才可以下载或查看,没有账号?立即注册

x
0bc29410df309f87931562ef66eecb3239976d35.jpg@308w_174h.jpeg

在线学习:



DrawanAudio是中国科学院自动化研究所和美团点评的研究人员推出的视频生成音频系统。

根据视频内容自动生成匹配的声音效果,类似于电影制作中的Foley艺术。系

统分析视频结合多种输入指令,如文本、视频遮罩和响度信号,生成与视频内容、时间和响度一致的音频。

核心架构包括潜在扩散模型(LDM)、文本条件模型、掩码注意力模块(MAM)和时间-响度模块(TLM),组件共同确保音频生成的高质量和准确性。

为视频内容创作者提供了一个强大的工具,声音设计过程更加高效和灵活。

Draw anAudio的技术原理
游客,如果您要查看本帖隐藏内容请回复


论文地址:传送门


评分

参与人数 1荣誉 +2 鱼币 +3 贡献 +3 收起 理由
鱼C-小师妹 + 2 + 3 + 3 鱼C有你更精彩^_^

查看全部评分

想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复

使用道具 举报

发表于 昨天 01:54 | 显示全部楼层
厉害
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复

使用道具 举报

发表于 7 小时前 | 显示全部楼层
厉害了
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

小黑屋|手机版|Archiver|鱼C工作室 ( 粤ICP备18085999号-1 | 粤公网安备 44051102000585号)

GMT+8, 2024-9-25 23:16

Powered by Discuz! X3.4

© 2001-2023 Discuz! Team.

快速回复 返回顶部 返回列表