您的位置:首页 >> 行业研究 >> 文章正文

计算机行业周报:ChatGPT重大升级,多模态拓宽应用边界

加入日期:2023-10-9 20:34:03

  顶尖财经网(www.58188.com)2023-10-9 20:34:03讯:

(以下内容从上海证券《计算机行业周报:ChatGPT重大升级,多模态拓宽应用边界》研报附件原文摘录)
市场回顾]
过去一周(9.25-9.28)上证综指下跌 0.70%,创业板指下跌 0.47%,沪深 300 指数下跌 1.32%,计算机(申万)指数上涨 0.21 %,跑赢上证综指 0.91pct,跑赢创业板指 0.68pct,跑赢沪深 300 指数 1.54pct,位列全行业第 6 名。
周观点
ChatGPT 迎语音、图像功能,多模态打开广阔应用空间。9月 25日,OpenAI 官宣将在 ChatGPT 推出新的语音和图像功能,其中新的语音功能由新的文本转语音模型提供支持,图像理解由多模态 GPT-3.5 和GPT-4 提供支持;上述功能允许用户展开语音对话或向 ChatGPT 展示其正在谈论的内容;未来两周内Plus和企业用户即可体验ChatGPT的上述功能。同时,OpenAI 发布《GPT-4V(ision) system card》,该论文概述了 OpenAI 为 GPT-4 部署视觉功能的方式,以及分析 GPT-4V的安全属性。论文指出 GPT-4V 的训练在 2022 年完成,并在 2023 年3 月开始提供早期访问系统。9 月 29 日,微软发布 166 页 GPT-4V 说明 书 《The Dawn of LMMs: Preliminary Explorations with GPT-4V(ision)》,对 GPT-4V 在十大任务上的表现进行详细测评,具体包括开放世界视觉理解、视觉描述、多模态知识、常识、场景文本理解、文档推理、写代码、时间推理、抽象推理、情感理解,并给出了使用GPT-4V 的新提示词技巧。我们认为,多模态赋能之下,AI 应用落地将加速推进,大模型应用场景将有效丰富。
多模态拓宽应用边界,算力需求迎指数级增长。1)多模态大模型涌现、渐成趋势。10 月 3 日,微软官网宣布将图像生成工具 DALL-E3 集成在 Bing Chat 和 Bing Image Create 中,并免费提供给用户使用。Midjourney 宣布今年之内将会推出性能对标 DALL·E 3 的图像生成工具 Midjourney V6;10 月 4 日,澳大利亚设计软件公司 Canva 与 AI 视频初创公司 Runway 合作推出新的视频生成工具 Magic Studio,允许用户输入文字或上传静态图片生成长达 18 秒视频。2)多模态对算力需求大幅攀升。语音、图像、视频数据大小显著高于文本,相对于文字交互有数个量级的提升。据 SemiAnalysi 分析师 Dylan Patel 和Daniel Nishball 透露,谷歌多模态大模型 Gemini 算力高达~1e26FLOPS,是训练 GPT-4 所需算力的 5 倍。3)科技巨头自研 AI 芯片,以减少对英伟达的依赖。10 月 7 日,据外媒透露,微软将于下个月推出其首款人工智能芯片“雅典娜”,雅典娜将与英伟达 H100 GPU 竞争;OpenAI 正探索自研 AI 芯片,并且已经开始评估潜在收购目标。
投资建议
建议关注:1)AI 龙头:金山办公科大讯飞同花顺等,2)AI 应用/工具:鼎捷软件、软通动力、致远互联拓尔思、星环科技、万兴科技汉得信息等,3)AI 算力:工业富联浪潮信息神州数码拓维信息烽火通信云赛智联等。
风险提示
下游景气度不及预期;政策推进不及预期;技术创新不及预期、行业竞争加剧。





编辑: 来源: