英伟达(NVDA.US)推出新AI模型Fugatto，可修正并生成新声响

发布时间：2025-05-21　点此：288次

智通财经APP得悉，英伟达(NVDA.US)推出了一款用于生成音乐和音频的新式人工智能(AI)模型，旨在为制造音乐、电影和视频游戏的人们供给服务。

依据英伟达的说法，这款模型名为Fugatto(Foundational Generative Audio Transformer Opus)，能够运用任何文本和音频文件来生成或修正音乐和声响。

例如，该模型能够依据文本提示创立音乐片段，从现有歌曲中删去或增加乐器，改动声响中的口音或心情，乃至宣布从未听过的声响。

英伟达运用音频研讨司理、管弦乐队指挥兼作曲家Rafael Valle表明：“咱们期望创立一个能像人类相同了解和发生声响的模型。”

英伟达指出，广告代理商能够运用Fugatto快速定位多个区域的现有广告，并在配音中参加不同的口音和情感。此外，视频游戏开发者能够运用人工智能模型修正游戏中预先录制的财物，以适运用户在玩游戏时不断改变的动作。

Fugatto能够使小号宣布狗吠声或萨克斯管宣布喵喵声。该公司弥补说，经过微谐和少数的歌唱数据，研讨人员发现它能够处理未经预先练习的使命，比如从文本中生成高质量的歌声。

英伟达表明，Fugatto的完好版别运用了25亿个参数，并在包括32个Nvidia H100 Tensor Core GPU的Nvidia DGX体系进步行了练习。该模型的全体作业耗时一年多。

Fugatto或许会与Runway等草创公司以及 Meta Platforms(META.US)等大公司的相似技能打开竞赛。10月，Meta 发布了名为Movie Gen的人工智能模型，该模型能够依据用户提示创立传神的视频和音频编排。

本年 2 月，ChatGPT制造商OpenAI推出了Sora，它能够依据文本指令创立传神且赋有想象力的场景。这家由微软(MSFT.US)支撑的公司尚未向大众发布文本转视频模型。

更多港股重磅资讯，下载智通财经app

更多港股及海外理财资讯，请点击www.zhitongcaijing.com（查找“智通财经”）；欲参加智通港股出资群，请加智通客服微信(ztcjkf)

本文源自：智通财经网

告发/反应