利来w66(中国)最给利的老牌_汽修产业

培智学校可视化教学

2025-02-23 23:14:10 作者：利国娱乐国际老牌w66 阅读量：



　　DeepSeek的横空出世引发了AI产业的深刻讨论。本文就DeepSeek对算力需求、芯片市场、技术创新、端侧智能、出口管制、投资逻辑、软件生态、开源生态以及中国科技资✅产估值等十个关键问题进行了深入分析。

　　我们认为DeepSeek本质是对现有AI算法的效率优化，短期可✅能导致训练需求下降，但随着模型普及和应用场景扩展，长期推理需求将✅显著增长，这种趋势类似于蒸汽机降低煤耗但提升煤炭总用量的历史现象。

　　AI算力大致分为1）用于研发前沿模型相关的探索性算力（AGI方向），2）面向消费者的应用性算力（现有模型推理）。目前北美四大AI公司主要通过扩大GPU集群规模的方式探索下一代大模型。只要这个探索工作㊣还在继续产生正向回报，AI算力的增长范式短期或不会发生变化。

　　我们认识到，1）未来大模型竞争中，算法效率的重要性或上升，投资重点可能㊣从算力军备转向算法效率。2）开源协议使中小开发者能基于前沿模型二次开发，创造更多创新机会。投资角度，看好美股软件表现好✅于硬件。

　　DeepSeek的成功显示即使不使用最先进的GPU，也可以开发满足一般消费者需求的大模型。这可能意味着，英伟达的Blackwell/Rubin等最先进的GPU的用途，可能会局限在探索下一代超大规模模型（Frontier Model）上。

　　DeepSeek在其V3技术报告中估计其训练成本只有557.6万美元，根据SemiAnalysis分析，这只包含预训练阶段的部分成本，而加上GPU算力投资，研发、数据收集等其他重要成本或远大于这个数字。

　　主要创新包括模型架构（混合专家MoE，MLA）、训练方法（纯强化学习）、蒸馏优化和推理效率提升等，显著提升了AI算法效率和性能。

　　目㊣前（2025/2/3），恒生科技指数12月前向PE㊣ 20.0倍，远低于纳斯达克的35.4倍。DeepSeek的成功可能提高中国AI公司估值预期。

　　DeepSeek的高性价比模型有利于模型在智能手机和汽车等智能✅设备上落地，我们认为智能硬件迭代不会一蹴而就，模型能力提升只是✅㊣其中一环。

　　我们注意到DeepSeek发布后培智学校可视化教学，美国媒体进一步限制中国发展AI声音抬头。建议关注后续：1）高端AI芯片出口管制，2）前沿模型的开源限制，3）模型回传限制，4）数据获取限制等风险。

　　目前基础大✅模型的开发，主要集中在OpenAI、Google、Anthropic、阿里，字节、百度的科技巨头手中。DeepSeek这次的成功丰富了AI开源生态，也为中小开发者依托开源生态实✅现快速发展提供了一条发展路径。

　　风险提示：中美贸易摩擦升级风险，宏观下行风险，创新品渗透不及预期风险。本研报中涉及到未上市公司或未覆盖个股内容，均系✅对其客观公开信息的整理，并不代表本研㊣究团队对该公司、该股票的推荐或覆盖。

　　DeepSeek的横空出世引发了AI产业的深刻讨论。本文就DeepSeek对算力需求、芯片市场、技术创新、端侧智能、出口管制、投资逻辑、软件生态、开源生态以及中国科技资产估值等十个✅关键问题进✅行了㊣深入分析。

　　据DeepSeek V3技术报告，V3模型的训✅练总计只需要278.8万 GPU小时，相当于在2048卡的H800GPU集群上训练约2个月，合计成本约557.6万美金，相较而言，Llama 3系列模型的计㊣算预算则多达 3930万 H100 GPU小时，DeepSeek训练成本约相当于Llama 3系列模型的7%。

　　我们认㊣为，DeepSeek对算力需求的影响呈现出短期抑制、长期增长的复杂趋势。短期内，DeepSeek的低成本高效训练方法可能导致训练需✅求㊣下降。然而，从长远来看，随着模型的普及和应用场景的扩展，推理需求将显著增长。这种趋势类似于蒸汽机降低煤耗但提升煤炭总用量的历史现象。

　　随着AI技术成本的下降，其应用范围将大幅扩㊣展，最终可能导致算力需求的大幅增长。微软C㊣EO纳德拉认为AI效率提升将激发指数级需求。

　　AI算力大致分为1）用✅于研发通向通用人工智能（AGI）的前沿模型相关的探索性算力（AGI方向），2）面向一般消费者的应用性算力（现有模型推理）。过去两年，推动算力增长的主要动力是，探索性算力增速（25x/2年）远高于摩尔定律（2倍/年），导致GPU需求激增。只要这个探索工作还在✅继续产生正向回报， AI算力的增长范式短期或不会发生变化。

　　1）1/24, Meta宣布计划2025年资本支出达600-650亿美元，主要用于AI基础设施（训练集群和数据中心建设）。

　　2）1/21，OpenAI宣布和软银、Oracle启动的“Project㊣ Stargate”计划投资超1000亿美元建设AI基础设施，显示资本仍✅集中流向需要海量算力的前沿探索。

　　根据Fa㊣ctset一致预期，微软、谷歌、亚马逊、Meta、苹果等北美五大㊣科技公司合计资本开支2025年有望继续增长19.6%。其中很大部分投入是用在包括GPT-5、Llama4等在内下一代模型的算力投资。另一方面，Agent等应用目前仍处于探索的初期阶段，大规模商用的时间点仍存在不确定性，所以我们认为目前AI算力的✅增长范式没有变化。

　　1）未来大模型公司之间的竞争中，算法效率的重要性可能上升，投资重点可能从算力军备转向算法效率。AI竞赛正从算力军备转向算法效率。未来的竞争重点或将更多地集中在算法优化和生态活力上。

　　2）开源协议能使中小开发者基于前沿模型二次开发，推动大模型创新从少数科技巨头向分布式社区转移，为中小软件企业创造更多创新机会。从投资角度，我们认为2025年是AI发展进入商业化落地的一年。以Agent AI为代表的企业软件有望迅速落地，提升企业工作效率，带动美股软件板块表现或好于硬件。

　　根据Jon Peddie Research，3Q24英伟达在㊣全球GPU市场份额达到90%。其中，H100等高端GPU是主要产品之一。Dee✅pSeek的成果显示，在面向一般消费者的大模型市场，企业可以通过使用A100、H800等相对低端的芯片实现类似性能。这可能会影响英伟达2025年以后，B200等最先进GPU在云计算、主权AI等领域的普及。Bla✅ckwell/Rubin等最先进的GPU的用途，初期可能会被局限在探索下一代超大规模模型（Fr㊣ontier Model）上。

　　据DeepSeek V3技术报告，V3模型的训练总计只需要278.8万 GPU小时，相当于在2048卡的H800GPU集群上训练约2个月，合计成本约557.6万美金，相较而言，Llama 3系列模型的计算预算则多达 3930万 H100 GPU小时，DeepSeek㊣训练成本约相当于Llama 3系列模型的7%。

　　但是，SemiAnalysis在报告中指出，557.6万美金这个数字主要指的是模型预训练的GPU成本，并不包括研发、数据收集、清理等㊣其他重要㊣成本。实际上，DeepSeek的总㊣体投资规模相当可观。据SemiAnalysis估计，其GPU投资就超过5亿美元。考虑到服务器资本支出、运营成本等因素，DeepSeek的总拥有成本(TCO)在4年内可能达到25.73亿美元。DeepSeek的成本优势主要体现在其高效的训练方法和创新的模型架构上。例如，其推理成本降至O㊣pe㊣nAI的1/50，这在实际应用中可以带来显著的成本节约。然而，这种成本优势并不意味着整体AI开发和运营成本的大幅降低。

　　DeepSeek在多个方面展现出技术创新，主要包括模型架构创新、训练方法突破、蒸馏优化、推理效率提升等。其中，混合专家(MoE)架构和多头潜在注意力(MLA)的引入显著提升了模型性能和效率。R1-zero模型采用纯强化学习(RL)训练，跳过㊣监督㊣微调，验证了RL在AI训练中的优先级和有效性。这些创新使DeepSeek在性能、效率和成本方面都取得了显著进展，为AI技术的发展提供了新的方向。特别是在解决复杂数学、物理和推理问题时，其速度是ChatGPT的两倍，且在编程问题上提供了迅速而全面的答案。

　　3）强化学习（R㊣L）：R1-zero模型跳过监督微调，通过纯RL直接训练，验证了RL的优先级和有效性；

　　目前（2025/2/3），恒生科技指数12月前向PE 20.0倍，远低于纳斯达克的35.4倍。DeepSee✅k的成功可能提高投资者对中国AI公司产业链的估值预期，吸引更多资本投资中国AI领域。

　　DeepSeek很可能会显著推动端侧智能的发展，其高性价比模型使得更多企业可能考虑在端侧设备上部署AI应用，推动智能设备的智能化进程。微软推出的专为NPU设计的DeepSeek-R1模型，支持Cop㊣ilot+PC等设备，实现半连续运行的主动㊣智能体验，为智能手机、汽车等端侧设备提供了高效本地化部署方案。DeepSeek的技术进步可能加速㊣端侧智能的普及㊣和发展，推动AI技术向更广泛的终端设备渗透，从而改变现有的计算范式和用户交互方式。这不仅㊣提升了端侧AI性能，还有助于保护用户隐私，降低了AI应✅用部署的技术门槛。

　　但是，从Apple Intelligence过去一年的发展历程中，我们看到，智能硬件的迭代㊣是㊣循序渐进过程，不会一蹴而就。模型能力提升只✅是其中一㊣环，还存在生态链协调等很多挑战，对2025年AI手机等端侧智能的发展不应抱过高预期。

　　3）模型回传限制：在2024年年底发布的出口管制政策中，美国政府已经限制在新加坡等第三国训练好的模型回传中国，阻止技术转移；

　　全球主要大模型公司中，OpenAI、Google、Anthropic、字节、百度等采用闭源模㊣式，Meta、阿里等采用开源模式。如下图所示，闭源模型一直保持对开源模型的性能优势。

　　这次DeepSeek通过✅开源接近最先进的闭源的高性能模型，可能降低AI技术的使用门槛。开源模式带来边际成本持续下降的技术红㊣利，为AI技术的真正普及奠定了基础。此外，DeepSeek的做法也可能推动其它AI公司重新思考其商业模式。

　　4）本研报中涉及到未上市公司或未覆盖个股内容，均系对其客观公开信息的整理，并不代表本研究团队对该公司、该股票的推荐或覆盖

上一篇：立体化数字教材

下一篇：智能化教学模式