全球首个!英伟达发布了一把用于“声音的瑞士军刀”
11月26日讯,全球英伟达近日展示了其最新研发的首个声音士军人工智能模型——Fugatto。
Fugatto是英伟用于一款基于生成式Transformer架构的人工智能模型,其完整版配备了25亿个参数,达发的瑞刀并在由32个NVIDIA H100 Tensor Core GPU组成的布把NVIDIA DGX系统上进行了训练。
这款模型的全球主要功能在于能够修改和生成声音效果,专为音乐、首个声音士军电影和视频游戏制作人设计,英伟用于英伟达将其形象地称为“声音的达发的瑞刀瑞士军刀”。
据NVIDIA应用音频研究经理Rafael Valle透露,布把Fugatto的全球研发初衷是创建一个能够像人类一样理解和生成声音的模型。
它支持多种音频生成和转换任务,首个声音士军是英伟用于首个展示紧急属性的基础生成式AI模型,这得益于其各种训练能力的达发的瑞刀交互以及组合自由格式指令的能力。
Fugatto的布把功能十分强大,能够根据文本描述生成音效和音乐,例如将钢琴演奏转换成人声歌唱,或改变录音的口音和情绪。
对于音乐制作人而言,Fugatto可以帮助他们快速制作原型或编辑歌曲创意,尝试不同的风格、声音和乐器,同时添加效果并提高现有轨道的整体音频质量。
广告代理商则可以利用Fugatto快速定位多个地区或情况的现有广告活动,将不同的口音和情感应用于画外音。
视频游戏开发人员则可以使用该模型修改游戏中预先录制的素材,或根据文本说明和可选的音频输入动态创建新素材。
另外,Fugatto 的新颖性主要体现在以下方面:
首先,在推理过程中,该模型采用了称为ComposableART的技术,能够组合在训练期间只能单独看到的指令。
例如,通过组合提示,可以要求模型以法国口音说出带有悲伤情绪的文本。
此外,该模型在指令之间进行插值的能力使用户能够对文本指令进行精细控制,如重音的沉重程度或悲伤的程度。
其次,Fugatto还能够生成随时间变化的声音,NVIDIA将这一功能称为时间插值。
例如,它可以模拟暴雨穿过区域的声音,雷声逐渐增强,然后慢慢消失在远处。这一功能使用户能够精细地控制音景的演变方式。
最后,与大多数只能重现所接触的训练数据的模型不同,Fugatto允许用户创建以前从未见过的音景。
例如,它可以模拟雷雨随着鸟儿的歌声缓和为黎明的场景。
总而言之,Fugatto凭借其功能多样性和创新性,在音频领域具有广阔的发展空间。
- ·小米蔚来强强联手!14000+蔚来充电桩正式入驻小米充电地图
- ·半场5射仅1正!摩根:阿森纳太需要好前锋,说了多少年就是没人听
- ·好了搞懂赛制了明天17飘柔争取拿前四!!!
- ·隆戈:普利西奇无缘欧冠对阵红星 下周一核磁共振检查小腿情况
- ·巴媒:奥斯卡将与圣保罗签约3年,未来几天内体检
- ·[流言板]篮板狂魔!哈滕全场3中1,得到2分16篮板6助攻1抢断1盖帽
- ·小米版Model Y来了!小米汽车官宣YU7 SUV登场:明年上市
- ·费迪南德:曼联在对待那些表现糟糕的球员时,也应该冷酷一点
- ·[流言板]关键!尚帕尼底角接球三分强投再中,马刺反超开拓者3分
- ·股价大跌2%以上!英伟达涉嫌违反反垄断法遭立案调查 曾成全球市值第一
- ·瓦尔迪一传一射,以37岁332天创造了英超传射历史第二高龄纪录
- ·足协公布首批完成债务清欠俱乐部名单 中超三队未上榜
- ·TGA 2024:《漫漫长夜2:Blackfrost》公布 2026年发售
- ·单板滑雪平行大回转世界杯美林站收官 毕野创中国队最好成绩
- ·《荒野起源》与《地平线》女角对比:还是腾讯版漂亮
- ·阿尔特塔:积分能否接近利物浦取决于我们自己津琴科受伤了
- ·NBA彩经:绿军击退灰熊 太阳败走迈阿密 独行侠大胜猛龙
- ·全球持续变暖!欧盟气候监测机构:今年将成有记录以来最热年份
- ·单板滑雪平行大回转世界杯美林站收官 毕野创中国队最好成绩
- ·真我Neo7塞进7000mAh超大电池 徐起:欢迎友商明年跟进
- ·[流言板]状态火热!爱德华兹全场砍下26分8篮板5助攻2抢断1封盖
- ·WhoScored评热刺+切尔西最佳阵:孙兴慜、帕尔默领衔,杰克逊入选
- ·能否延续?巴萨此前4次对阵多特保持不败
- ·xdd和summer的组合 其实还是可观的。xdd杀起来 唯一喊牛逼的就是summer
- ·云台投影仪和普通投影仪的区别是什么 2025年三款云台投影仪选购评测推荐
- ·能否再次做到?多特上一次欧冠前6场取得5胜是1997/98赛季