您的位置:首页 >> 行业研究 >> 文章正文

互联网传媒行业周观点:国内首款AI音乐生成大模型启动内测,谷歌发布Gemini1.5Pro

加入日期:2024-4-18 10:40:05

  顶尖财经网(www.58188.com)2024-4-18 10:40:05讯:

(以下内容从上海证券《互联网传媒行业周观点:国内首款AI音乐生成大模型启动内测,谷歌发布Gemini 1.5 Pro》研报附件原文摘录)
主要观点
4月2日,昆仑万维打造的国内首款AI音乐生成大模型“天工SkyMusic”开启邀请测试,该模型拥有流畅的编配、好听的旋律,逼真且充满情感的人声。除歌曲整体的音乐品质之外,“天工SkyMusic”拥有清晰逼真的人声,模型的AI人声合成能够产生中文水平极高、发音清晰的歌声,展现出卓越的音频质量和逼真的演唱效果,在中文发音上优于国外大模型。与市面上Suno等AI音乐工具相比,AI音乐生成大模型“天工SkyMusic”采用的是基于MoE架构的4000亿级参数多模态超级大模型“天工3.0”,在逻辑推理、语义理解和泛化能力的加持下,“天工SkyMusic”的响应速度和训练推理效率较高。
4月10日,谷歌在官网正式发布了Gemini1.5Pro,现在可在180多个国家/地区使用。Gemini1.5Pro除了能生成创意文本、代码之外,能根据用户输入的文本提示,理解、总结上传的视频、音频内容进行深度总结,并且支持100万tokens上下文,目前可以在Google AIStudio开发平台中免费试用。谷歌对API进行三个优化:1)系统指令方面,可以在Google AI Studio和Gemini API中使用系统指令功能,可指导模型的响应输出,让用户根据其特定需求和用例控制模型的行为;2)JSON模式方面,Gemini API提供了用于请求JSON格式的配置参数,可以帮助开发者从文本或图像中提取结构化数据;3)函数调用优化方面,开发者可使用自定义函数并将其提供给AI模型。
“天工SkyMusic”在情感表达的准确性、多样性,以及歌词段落情绪变化的敏感捕捉较准确,我们认为AI在音乐生成领域已取得实质性进展,AI也在持续创新探索写作、绘画、动画等领域。在大语言模型百花齐放阶段,我们认为国内大厂持续投入大语言模型,有望打造出更适合中国的AI生产力工具。目前AIGC行情已有所分化,未来主题性机会有望逐步切换向案例兑现、甚至基本面兑现,龙头及龙头板块需重点关注,持续推荐具备基本面优势的【游戏】板块。
投资建议
基于我们“大模型+小模型+应用及内容”的研究框架,我们认为从基本面受益的角度上看,需沿着目前成熟大模型模态输出的范围选择标的,重点关注AI+文本/虚拟人板块,其次关注AI+图片(大模型+小模型);从价值重估的角度上看,需沿着掌握优质数据或内容(多模态数据)的范围选择标的,重点关注AI+内容/IP/版权板块。
AI行情分化趋势下,建议重点关注基本面优异的【游戏】及【出版】板块:
1、AI:关注【昆仑万维】;推荐【创业黑马】。
2、MR:推荐【风语筑】;关注【宝通科技】。
3、游戏新模式:推荐【盛天网络】、【完美世界】、【三七互娱】。4、影视新模式:关注【中文在线】、【上海电影】、【光线传媒】、【华策影视】。
风险提示
政策边际优化的程度不及预期、AI推进进度不及预期、AIGC商业模式或落地场景效果不及预期、内容监管趋严。





编辑: 来源: