您的位置:首页 >> 行业研究 >> 文章正文

计算机行业先进科技主题周报:英伟达发布H200,生成式AI算力设施再演进

加入日期:2023-11-24 10:35:25

  顶尖财经网(www.58188.com)2023-11-24 10:35:25讯:

(以下内容从上海证券《计算机行业先进科技主题周报:英伟达发布H200,生成式AI算力设施再演进》研报附件原文摘录)
主要观点
年初以来,以GPT为代表的生成式人工智能模型持续落地和商业化,展现出生成式人工智能模型在办公、教育等场景下的巨大潜力。作为人工智能模型训练与应用部署的重要基础设施, 面向人工智能的算力设施设计指标也不断升级,促使以算力和通信为代表的人工智能基础设施迎来新的增长空间。
本周上证指数报收3054.37点,周涨跌幅为+0.51%;深证成指报收9979.69点,周涨跌幅为+0.01%;创业板指报收1986.53点,周涨跌幅为-0.93%;沪深300指数报收3568.07点,周涨跌幅为-0.51%。中证人工智能指数报收1096.65点,周涨跌幅+2.77%,板块跑赢大盘。
在人工智能主线方面,本周值得关注的有:
1) NVIDIA面向推理场景发布H200: 在SC23上, NVIDIA宣布推出NVIDIA HGX H200。 NVIDIA HGX H200基于NVIDIA Hopper架构,配备NVIDIA H200 Tensor Core GPU和HBM3e显存,能够更好地支持处理生成式AI和高性能计算场景下的工作负载。 NVIDIA H200所配备的141GB HBM3e显存拥有4.8 TB/s的带宽,与NVIDIA H100 相比,显存增加76%,带宽增加43%。以Llama2-70B模型为例, NVIDIA H200的推理速度是NVIDIA H100的1.9倍,大幅提高了对生成式AI推理场景的支持能力。
2) 微软发布面向AI场景的ASIC芯片, Microsoft 365 Copilot正式开放商用: 微软在今年的Ignite大会上发布了针对生成式AI场景进行了优化的ASIC芯片—Maia 100,以及专为在Microsoft云上运行通用计算工作负载而设计的Arm架构CPU—Cobalt 100。 在内存带宽方面, Maia100配置了1.6TB/s的带宽, 介于同为CSPs自研ASIC芯片的TPU v5和Trainium/Inferentia2之间。 在网络方面, 类似于TPU v5的专有ICI网络, 每块Maia 100拥有内置的RDMA以太网IO,单块芯片的单向IO速率为4.8Tb/s, 超越了NVIDIA和AMD的最新计算卡。 此外, Microsoft365 Copilot正式面向企业开放商用,而OpenAI发布的GPT-3.5Turbo、 GPT-4 Turbo、 DALLE· 3也在微软Azure上正式商用或发布了预览版本。
3) 可穿戴设备AI Pin问世: 初创公司Humane发布了其首款配置了生成式AI语言助理的可穿戴设备AI Pin,并于11月16日正式上市。 AI Pin可以固定在衣物上, 通过激光将显示界面投射到手掌上,然后通过点击、手势或语音来完成交互。 根据Humane公布的配置, AI Pin搭载的是一款未知型号的高通8核心SoC,峰值频率为2.1GHz, 低于同样为8核心的高通8 Gen3。
我们认为:(1) 算力端: H200在硬件配置上,较H100提升了显存容量和显存带宽,针对推理场景进行了优化, 有望助力解决推理端算力紧缺的现状,为下一阶段生成式AI应用的落地奠定基础。 同时,在端侧算力方面, 以AI Pin和Google Pixel 8为代表的终端设备开始配备AI助手类应用, 考虑到网络连接的不稳定性等因素,部分不依赖网络的端侧的推理成为生成式AI落地的重要方向。(2) 算法端: 具备文生文或文生图功能的生成式AI模型不断迭代升级, 以Microsoft 365 Copilot为代表的AI+办公应用正借助成熟模型加速落地。(3) 应用端: 随着算力设施支持能力的提升,以及算法持续迭代,人工智能应用有望逐步丰富并不断降低使用成本。此外,本周卫星通信领域也值得关注:
Starship运载火箭第二次试射: 由SpaceX公司研发并生产的Starship(星舰) 运载火箭进行了第二次试射。 试射过程中, 一、二级火箭进行了热分离。 星舰目前的设计最大载荷为100-150吨,是同样由SpaceX公司研发的猎鹰9号运载火箭的至少4.4倍。 我们认为:星舰相较其他在役的运载火箭,具有载荷大、 单次使用成本低的优点。若火箭能完成设计和验证, 有望进一步降低卫星发射成本,有助于低轨道通信卫星的大批量发射,或将加速卫星互联网的落地进度,降低长期维护成本。
投资建议
我们建议:跟踪生成式AI发展进程,应优先关注商业化落地的性价比,特别是有无充足的算力设施支持其后续的发展。在商业化落地的过程中,前期算力设施领域的增长空间会较为明显,且具有较高的确定性。后期随着软件应用的成熟,应优先关注需求具有较高确定性的高成长空间赛道中, 上下游绑定较为紧密, 具有较高行业壁垒的低估值公司。
科技板块中, 建议关注以下赛道:
1) 液冷: 随着GPU服务器上架数量的不断提高, 其散热问题也逐渐受到关注。近年来,通信运营商和地方政府陆续发布文件,对新建和存量数据中心的PUE等关键能耗指标做出限制。 这有利于液冷在服务器市场提高渗透率,实现确定下较高的增长。与下游服务器厂商有较强合作关系的液冷厂商, 有望取得较好的营收和利润增长。
2) 光模块/光引擎: 在GPU服务器集群中,交换机与交换机间往往采取光缆连接,由于GPU互相访问显存的需要,网络架构需具备低延迟、高速率的特性。因此, 800G、 400G光模块爆发了较大的需求量,此前研发、测试进度较快,与Google、 NVIDIA等下游客户已存在合作关系的行业头部企业有望获得竞争优势。
3) AI+办公/AI+教育: 随着AI+办公领域生成式AI应用的迭代成熟,有望进一步提高渗透率,实现相关企业的发展。今年以来,以搭载生成式AI应用的智能学习机为代表的智慧教育赛道发展迅速。 相较平板+APP的传统模式,智能学习机更适合教育场景,有望助力生成式AI在教育领域快速实现落地。
风险提示
下游需求不及预期;人工智能技术落地和商业化不及预期;产业政策转变;宏观经济不及预期等





编辑: 来源: