欢迎访问黑料吃瓜网

10年专注吃瓜

吃瓜质量有保 售后7×24小时服务

24小时咨询热线:4006666666
您的位置:首页>>166吃瓜>>正文

166吃瓜

英伟达(NVDA.US)推出新AI模型Fugatto,可修正并生成新声响

发布时间:2025-05-21 点此:260次

智通财经APP得悉,英伟达(NVDA.US)推出了一款用于生成音乐和音频的新式人工智能(AI)模型,旨在为制造音乐、电影和视频游戏的人们供给服务。

细腻的英伟达(NVDA.US)推出新AI模型Fugatto,可修改并生成新声音的插图

依据英伟达的说法,这款模型名为Fugatto(Foundational Generative Audio Transformer Opus),能够运用任何文本和音频文件来生成或修正音乐和声响。

例如,该模型能够依据文本提示创立音乐片段,从现有歌曲中删去或增加乐器,改动声响中的口音或心情,乃至宣布从未听过的声响。

英伟达运用音频研讨司理、管弦乐队指挥兼作曲家Rafael Valle表明:“咱们期望创立一个能像人类相同了解和发生声响的模型。”

英伟达指出,广告代理商能够运用Fugatto快速定位多个区域的现有广告,并在配音中参加不同的口音和情感。此外,视频游戏开发者能够运用人工智能模型修正游戏中预先录制的财物,以适运用户在玩游戏时不断改变的动作。

梦幻的英伟达(NVDA.US)推出新AI模型Fugatto,可修改并生成新声音的图像

Fugatto能够使小号宣布狗吠声或萨克斯管宣布喵喵声。该公司弥补说,经过微谐和少数的歌唱数据,研讨人员发现它能够处理未经预先练习的使命,比如从文本中生成高质量的歌声。

英伟达表明,Fugatto的完好版别运用了25亿个参数,并在包括32个Nvidia H100 Tensor Core GPU的Nvidia DGX体系进步行了练习。该模型的全体作业耗时一年多。

Fugatto或许会与Runway等草创公司以及 Meta Platforms(META.US)等大公司的相似技能打开竞赛。10月,Meta 发布了名为Movie Gen的人工智能模型,该模型能够依据用户提示创立传神的视频和音频编排。

本年 2 月,ChatGPT制造商OpenAI推出了Sora,它能够依据文本指令创立传神且赋有想象力的场景。这家由微软(MSFT.US)支撑的公司尚未向大众发布文本转视频模型。

英伟达(NVDA.US)推出新AI模型Fugatto,可修改并生成新声音的图像

更多港股重磅资讯,下载智通财经app

更多港股及海外理财资讯,请点击www.zhitongcaijing.com(查找“智通财经”);欲参加智通港股出资群,请加智通客服微信(ztcjkf)

本文源自:智通财经网

告发/反应
标签: 伟达 NVDA US AI Fugatto

相关推荐

在线客服
服务热线

24小时咨询热线:

4006666666

微信咨询
每日吃瓜网
返回顶部