您的位置:首页 >> 行业研究 >> 文章正文

计算机行业研究:Sunov3推出降低音乐创作门槛,关注文生音频投资机会

加入日期:2024-3-25 12:29:38

  顶尖财经网(www.58188.com)2024-3-25 12:29:38讯:

(以下内容从国金证券《计算机行业研究:Suno v3推出降低音乐创作门槛,关注文生音频投资机会》研报附件原文摘录)
事件点评
Sunov3版本于3月22日推出,可在几秒钟内创作完整的两分钟歌曲。1)具备文生音频能力:用户可以通过输入简短的文本描述来生成歌曲,公司认为Sunov3是他们第一个能够制作广播质量音乐的模型。2)支持多风格音乐创作:Suno模型能够处理多种音乐风格,包括但不限于蓝调(Blues)、民谣(Folk)、流行(Pop)等。3)相比之前版本有较大改进:V3能够提供更好的音频质量、更多风格和流派、并提升了对提示词的依从(如减少幻觉、优化结尾)。
Suno能力侧重于音频生产,在歌词与标题生成角度与OpenAI有合作。在模型运行时,Suno模型创作了所有音乐,同时调用OpenAI的ChatGPT生成歌词,甚至可以生成标题。
创始团队音频AI经验丰富且有部分音乐家、公司表示尊重艺术家知识产权、可能拥有潜在社交功能。1)4位联合创始人共12名员工。迄今为止Suno成立还未超过2年时间,联合创始人Shulman、Freyberg、GeorgKucsko和MartinCamacho都为机器学习专家,之前就职于KenshoTechnologies(致力于开发转录技术用于捕捉上市公司财报电话会)。其中Shulman和卡马乔Camacho还都是音乐家。目前团队在计划扩大规模。2)Suno考虑了艺术家和知识产权尊重。不允许用户请求特定艺术家的风格,并且不使用真实艺术家的声音,同时V3开发了专有无声水印技术,可检测歌曲是否为Suno创建。3)目前未透露模型训练数据细节。只透露数据除了音乐之外,还包括语音录音。4)Suno的模型生成的音乐可以被用户分享给朋友,我们预计未来有可能具备潜在社交功能属性。
投资建议
文生音频可能潜在替代广告、电视、影视部分音乐创作,重视文生音频投资机会。推荐关注:1)万兴科技:天幕音视频多媒体大模型已发布,具备通用解决方案及垂类解决方案,能够一条龙从模型端到音视频应用场景满足客户需求。2)科大讯飞:作为AI语音领域龙头公司,讯飞拥有丰富的中文语料,有望拓宽音乐生成场景。3)海天瑞声:中国领先训练数据专业提供商,具备丰富语音语料,AI文生音频应用落地有望带动大量训练数据需求。
风险提示
底层大模型迭代发展不及预期的风险;算力不足的风险;行业竞争加剧的风险。





编辑: 来源: