人工智能艺术生成器Stable Diffusion背后的初创公司Stability AI发布了一个用于生成声音和歌曲的开放式人工智能模型,并声称该模型完全是在免版税录音基础上训练出来的。该模型名为"稳定的音频开放",它采用文本描述(例如,"在经过处理的录音室中演奏的摇滚节拍,在原声套件上打鼓"),并输出长度不超过47秒的录音。
_k&vW(O=: +5voAx! 该模型使用来自免费音乐库FreeSound和免费音乐档案馆的约486,000个样本进行训练。
3{CXIS MFRM M%` Stability AI公司称,该模型可用于为视频、电影和电视节目创建鼓点、乐器旋律、环境噪音和"制作元素",也可用于"编辑"现有歌曲或将一首歌的风格(如流畅爵士乐)应用到另一首歌中。
H8X{!/,^ s~3"*,3@ Stability AI公司在其公司博客上发表的一篇文章中写道:"此次开源发布的一个主要好处是,用户可以根据自己的自定义音频数据对模型进行微调。例如,鼓手可以在自己的鼓声录音样本上进行微调,生成新的节拍。"
*&XOzaVU 04o(05K 不过,Stable Audio Open也有其局限性。它不能生成完整的歌曲、旋律或人声,至少不能生成好的歌曲、旋律或人声。Stability AI表示,它并没有为此进行优化,并建议希望获得这些功能的用户选择该公司的高级Stable Audio服务。
`$05+UU .^eajb`: Stable Audio Open也不能用于商业用途,其服务条款禁止这样做。此外,它在不同音乐风格和文化或英语以外的语言描述中的表现也不尽相同,Stability AI将这些偏差归咎于训练数据。
U 1vZr{\ *y0TtEd; "数据源可能缺乏多样性,所有文化在数据集中都不具有同等代表性,"Stability AI公司在对模型的描述中写道。"模型生成的样本将反映训练数据的偏差"。
tmKHT Ch>r.OfP 稳定人工智能公司(Stability AI)长期以来一直在努力扭转业务颓势,最近,该公司负责生成音频的副总裁埃德-牛顿-雷克斯(Ed Newton-Rex)因不同意该公司关于在受版权保护的作品上训练生成人工智能模型构成"合理使用"的立场而辞职,从而引发争议。Stable Audio Open似乎试图扭转这种说法,同时不着痕迹地宣传Stability AI的付费产品。
K9]L>Wj tw,uV)xm 随着包括Stability音乐生成器在内的音乐生成器越来越受欢迎,版权--以及一些生成器创建者可能滥用版权的方式--正成为人们关注的焦点。
xQ%N%
` PY[nnoF"| 5月,代表比利-乔尔(Billy Joel)、Doja Cat和Lil Nas X等艺术家的索尼音乐公司致函700家人工智能公司,警告不要"未经授权使用"其内容来训练音频生成器。今年3月,美国田纳西州签署了第一部旨在遏制人工智能在音乐领域滥用的法律。
9!;/+P