电话
028-6313-9999
邮箱
joyouai@j455ai.com
TOP
2025-02-23 23:14:10 作者:利国娱乐国际老牌w66 阅读量:
DeepSeek的横空出世引发了AI产业的深刻讨论。本文就DeepSeek对算力需求、芯片市场、技术创新、端侧智能、出口管制、投资逻辑、软件生态、开源生态以及中国科技资✅产估值等十个关键问题进行了深入分析。
我们认为DeepSeek本质是对现有AI算法的效率优化,短期可✅能导致训练需求下降,但随着模型普及和应用场景扩展,长期推理需求将✅显著增长,这种趋势类似于蒸汽机降低煤耗但提升煤炭总用量的历史现象。
AI算力大致分为1)用于研发前沿模型相关的探索性算力(AGI方向),2)面向消费者的应用性算力(现有模型推理)。目前北美四大AI公司主要通过扩大GPU集群规模的方式探索下一代大模型。只要这个探索工作㊣还在继续产生正向回报,AI算力的增长范式短期或不会发生变化。
我们认识到,1)未来大模型竞争中,算法效率的重要性或上升, 投资重点可能㊣从算力军备转向算法效率。2)开源协议使中小开发者能基于前沿模型二次开发,创造更多创新机会。投资角度,看好美股软件表现好✅于硬件。
DeepSeek的成功显示即使不使用最先进的GPU,也可以开发满足一般消费者需求的大模型。这可能意味着,英伟达的Blackwell/Rubin等最先进的GPU的用途,可能会局限在探索下一代超大规模模型(Frontier Model)上。
DeepSeek在其V3技术报告中估计其训练成本只有557.6万美元,根据SemiAnalysis分析,这只包含预训练阶段的部分成本,而加上GPU算力投资,研发、数据收集等其他重要成本或远大于这个数字。
主要创新包括模型架构(混合专家MoE,MLA)、训练方法(纯强化学习)、蒸馏优化和推理效率提升等,显著提升了AI算法效率和性能。
目㊣前(2025/2/3),恒生科技指数12月前向PE㊣ 20.0倍,远低于纳斯达克的35.4倍。DeepSeek的成功可能提高中国AI公司估值预期。
DeepSeek的高性价比模型有利于模型在智能手机和汽车等智能✅设备上落地,我们认为智能硬件迭代不会一蹴而就,模型能力提升只是✅㊣其中一环。
我们注意到DeepSeek发布后培智学校可视化教学,美国媒体进一步限制中国发展AI声音抬头。建议关注后续:1)高端AI芯片出口管制,2)前沿模型的开源限制,3)模型回传限制,4)数据获取限制等风险。
目前基础大✅模型的开发,主要集中在OpenAI、Google、Anthropic、阿里,字节、百度的科技巨头手中。DeepSeek这次的成功丰富了AI开源生态,也为中小开发者依托开源生态实✅现快速发展提供了一条发展路径。
风险提示:中美贸易摩擦升级风险,宏观下行风险,创新品渗透不及预期风险。本研报中涉及到未上市公司或未覆盖个股内容,均系✅对其客观公开信息的整理,并不代表本研㊣究团队对该公司、该股票的推荐或覆盖。
DeepSeek的横空出世引发了AI产业的深刻讨论。本文就DeepSeek对算力需求、芯片市场、技术创新、端侧智能、出口管制、投资逻辑、软件生态、开源生态以及中国科技资产估值等十个✅关键问题进✅行了㊣深入分析。
据DeepSeek V3技术报告,V3模型的训✅练总计只需要278.8万 GPU小时,相当于在2048卡的H800GPU集群上训练约2个月,合计成本约557.6万美金,相较而言,Llama 3系列模型的计㊣算预算则多达 3930万 H100 GPU小时,DeepSeek训练成本约相当于Llama 3系列模型的7%。
我们认㊣为,DeepSeek对算力需求的影响呈现出短期抑制、长期增长的复杂趋势。短期内,DeepSeek的低成本高效训练方法可能导致训练需✅求㊣下降。然而,从长远来看,随着模型的普及和应用场景的扩展,推理需求将显著增长。这种趋势类似于蒸汽机降低煤耗但提升煤炭总用量的历史现象。
随着AI技术成本的下降,其应用范围将大幅扩㊣展,最终可能导致算力需求的大幅增长。微软C㊣EO纳德拉认为AI效率提升将激发指数级需求。
AI算力大致分为1)用✅于研发通向通用人工智能(AGI)的前沿模型相关的探索性算力(AGI方向),2)面向一般消费者的应用性算力(现有模型推理)。过去两年,推动算力增长的主要动力是,探索性算力增速(25x/2年)远高于摩尔定律(2倍/年),导致GPU需求激增。只要这个探索工作还在✅继续产生正向回报, AI算力的增长范式短期或不会发生变化。
1)1/24, Meta宣布计划2025年资本支出达600-650亿美元,主要用于AI基础设施(训练集群和数据中心建设)。
2)1/21,OpenAI宣布和软银、Oracle启动的“Project㊣ Stargate”计划投资超1000亿美元建设AI基础设施,显示资本仍✅集中流向需要海量算力的前沿探索。
根据Fa㊣ctset一致预期,微软、谷歌、亚马逊、Meta、苹果等北美五大㊣科技公司合计资本开支2025年有望继续增长19.6%。其中很大部分投入是用在包括GPT-5、Llama4等在内下一代模型的算力投资。另一方面,Agent等应用目前仍处于探索的初期阶段,大规模商用的时间点仍存在不确定性,所以我们认为目前AI算力的✅增长范式没有变化。
1) 未来大模型公司之间的竞争中,算法效率的重要性可能上升, 投资重点可能从算力军备转向算法效率。AI竞赛正从算力军备转向算法效率。未来的竞争重点或将更多地集中在算法优化和生态活力上。
2) 开源协议能使中小开发者基于前沿模型二次开发,推动大模型创新从少数科技巨头向分布式社区转移,为中小软件企业创造更多创新机会。从投资角度,我们认为2025年是AI发展进入商业化落地的一年。以Agent AI为代表的企业软件有望迅速落地,提升企业工作效率,带动美股软件板块表现或好于硬件。
根据Jon Peddie Research,3Q24英伟达在㊣全球GPU市场份额达到90%。其中,H100等高端GPU是主要产品之一。Dee✅pSeek的成果显示,在面向一般消费者的大模型市场,企业可以通过使用A100、H800等相对低端的芯片实现类似性能。这可能会影响英伟达2025年以后,B200等最先进GPU在云计算、主权AI等领域的普及。Bla✅ckwell/Rubin等最先进的GPU的用途,初期可能会被局限在探索下一代超大规模模型(Fr㊣ontier Model)上。
据DeepSeek V3技术报告,V3模型的训练总计只需要278.8万 GPU小时,相当于在2048卡的H800GPU集群上训练约2个月,合计成本约557.6万美金,相较而言,Llama 3系列模型的计算预算则多达 3930万 H100 GPU小时,DeepSeek㊣训练成本约相当于Llama 3系列模型的7%。
但是,SemiAnalysis在报告中指出,557.6万美金这个数字主要指的是模型预训练的GPU成本,并不包括研发、数据收集、清理等㊣其他重要㊣成本。实际上,DeepSeek的总㊣体投资规模相当可观。据SemiAnalysis估计,其GPU投资就超过5亿美元。考虑到服务器资本支出、运营成本等因素,DeepSeek的总拥有成本(TCO)在4年内可能达到25.73亿美元。DeepSeek的成本优势主要体现在其高效的训练方法和创新的模型架构上。例如,其推理成本降至O㊣pe㊣nAI的1/50,这在实际应用中可以带来显著的成本节约。然而,这种成本优势并不意味着整体AI开发和运营成本的大幅降低。
DeepSeek在多个方面展现出技术创新,主要包括模型架构创新、训练方法突破、蒸馏优化、推理效率提升等。其中,混合专家(MoE)架构和多头潜在注意力(MLA)的引入显著提升了模型性能和效率。R1-zero模型采用纯强化学习(RL)训练,跳过㊣监督㊣微调,验证了RL在AI训练中的优先级和有效性。这些创新使DeepSeek在性能、效率和成本方面都取得了显著进展,为AI技术的发展提供了新的方向。特别是在解决复杂数学、物理和推理问题时,其速度是ChatGPT的两倍,且在编程问题上提供了迅速而全面的答案。
3)强化学习(R㊣L):R1-zero模型跳过监督微调,通过纯RL直接训练,验证了RL的优先级和有效性;
目前(2025/2/3),恒生科技指数12月前向PE 20.0倍,远低于纳斯达克的35.4倍。DeepSee✅k的成功可能提高投资者对中国AI公司产业链的估值预期,吸引更多资本投资中国AI领域。
DeepSeek很可能会显著推动端侧智能的发展,其高性价比模型使得更多企业可能考虑在端侧设备上部署AI应用,推动智能设备的智能化进程。微软推出的专为NPU设计的DeepSeek-R1模型,支持Cop㊣ilot+PC等设备,实现半连续运行的主动㊣智能体验,为智能手机、汽车等端侧设备提供了高效本地化部署方案。DeepSeek的技术进步可能加速㊣端侧智能的普及㊣和发展,推动AI技术向更广泛的终端设备渗透,从而改变现有的计算范式和用户交互方式。这不仅㊣提升了端侧AI性能,还有助于保护用户隐私,降低了AI应✅用部署的技术门槛。
但是,从Apple Intelligence过去一年的发展历程中,我们看到,智能硬件的迭代㊣是㊣循序渐进过程,不会一蹴而就。模型能力提升只✅是其中一㊣环,还存在生态链协调等很多挑战,对2025年AI手机等端侧智能的发展不应抱过高预期。
3)模型回传限制:在2024年年底发布的出口管制政策中,美国政府已经限制在新加坡等第三国训练好的模型回传中国,阻止技术转移;
全球主要大模型公司中,OpenAI、Google、Anthropic、字节、百度等采用闭源模㊣式,Meta、阿里等采用开源模式。如下图所示,闭源模型一直保持对开源模型的性能优势。
这次DeepSeek通过✅开源接近最先进的闭源的高性能模型,可能降低AI技术的使用门槛。开源模式带来边际成本持续下降的技术红㊣利,为AI技术的真正普及奠定了基础。此外,DeepSeek的做法也可能推动其它AI公司重新思考其商业模式。
4)本研报中涉及到未上市公司或未覆盖个股内容,均系对其客观公开信息的整理,并不代表本研究团队对该公司、该股票的推荐或覆盖
上一篇:立体化数字教材 下一篇:智能化教学模式