金年金字招牌(jinnian)今年会今年会2024-别高估英伟达,别低估DeepSeek

作者:今年会今年会2024 发布时间:2026-05-04 23:56:04

  首页财产ai正文 别高估英伟达,别低估DeepSeek 4月24日DeepSeek-V4预览版上线并开源,创始全新留意力机制。 2026-04-26 13:09 ·虎嗅网作者 董必政 编纂 丁萍 AI投资人解读· DeepSeek-V4上线并开源,创始全新留意力机制,年夜幅降低计较及显存需求,优先适配国产芯片厂商。2023年末中 美顶级模子差距于20%-30%,如今已经收窄至2.7%。· 行业竞争激烈,国产GPU显存容量及带宽较低。政策方面,美国对于英伟达芯片出口管束。总结:DeepSeek-V4的呈现或者转变AI财产链格式,利好国产算力和AI运用。虽英伟达短时间内上风难被替换,但DeepSeek正崩溃其上风,值患上存眷国产算力成长和相干投资时机。内容由AI天生,仅供参考

DeepSeek-V4终究来了。

4月24日,全新系列模子DeepSeek-V4预览版本正式上线,并同步开源。

DeepSeek-V4创始了一种全新的留意力机制,于token维度举行压缩,联合DSA稀少留意力(DeepSeek Sparse Attention),实现了全世界领 先的长上下文能力,而且比拟在传统要领年夜幅降低了对于计较及显存的需求。

可别小瞧了,DeepSeek-V4年夜幅降低了对于计较及显存的需求。

妙投认为,这将直接减弱英伟达GPU的上风。值患上留意的是,DeepSeek-V4还有优先适配国产芯片厂商。

换句话说,别高估英伟达的护城河,也万万别低估DeepSeek正于掀起的这场架构革命。要害不于“谁替换谁”,而于AI财产链的利润分配、部署路径及投资逻辑,可能正于变。

戴着“枷锁”起舞

已往两年,AI年夜模子重要看的是练习,拼的是算力。

于必然水平上,AI基础年夜模子的竞争,素质就是GPU算力基础举措措施的竞争。谁能买到更多高端GPU,谁能堆出更年夜的集群,谁就更有时机做出更强的基础模子。

然而,因为美国经由过程出口管束,禁止英伟达H100/H200等顶 级芯片对于华发卖。此外,台积电进步前辈制程等已经经被美国卡死了,国产GPU卡与英伟达卡仍有必然的差距。

“海内GPU厂商都是戴着“枷锁”与英伟达同台竞技的”,一名GPU企业人士曾经向妙投形容。

成心思的是,就是于如许的逆风局下,这两年中 美年夜模子的差距最先慢慢缩小,甚至靠近拉平。

2023年末,中 美的顶 级模子于各年夜维度的差距还有于20%-30%之间倘佯。4月14日,斯坦福年夜学HAI试验室发布2026年度《AI指数陈诉》,这份长达423页的行业权势巨子陈诉显示,中 美年夜模子机能差距已经收窄至2.7%,基本实现技能追平。

妙投认为,假如把中 美AI年夜模子机能差距看做成果,那末英伟达GPU并不是决议性因素。

这一方面,归结在国产芯片突起和中国电力基础举措措施的完整。

黄仁勋于近来访谈中暗示,“AI素质上是并行计较问题,中国彻底可以经由过程重叠更多芯片来填补单颗芯片的制程差距,中国有那末多能源,假如愿意,彻底可以把更多芯片组合于一路,纵然制程掉队几个纳米。”

现实上,不少海内GPU厂商已经实现了万卡集群,以填补单卡算力的短板。好比:摩尔的夸娥万卡集群、沐曦的曦源一号SADA万卡集群。

另外一方面,则归结在DeepSeek为代表的年夜模子企业脱颖而出。

DeepSeek用软件上的前瞻性设计,自动去适配及赋能国产硬件,为国产芯片摊平门路。

好比:DeepSeek-V3验证了FP8于年夜范围模子练习的可用性,于不增长分外开消的环境下扩展了模子练习范围且不影响模子练习质量。

打个比喻,已往,要完成一个繁杂的AI计较使命,需要几台巨年夜、周详且昂贵的德国入口机床(代表英伟达的高精度GPU)。而此刻,DeepSeek经由过程转变使命的加工流程(即转变数据格局),使患上这个使命可以被几十台小巧、简朴且自制的国产机床(代表国产GPU的计较单位)构成的流水线高效完成。

即便云云,英伟达GPU仍让海外年夜模子于练习上更胜一筹。

但从财产演进看,年夜模子练习只是第 一阶段。年夜模子做出来以后,真正决议贸易化速率及财产渗入深度的,是推理。特别是,Openclaw、Hermes为代表的Agent爆火以后。

英伟达赢了练习,但推理才刚最先

练习及推理是两种差别的模式。

Claw类Agent发作,长上下文影象能力就是焦点导火索。

之前的AI只会谈天、回头就忘,鱼的影象;而Claw能记住一切、连续干活、越用越懂你,影象让它从 “玩具” 酿成 “东西”。

当上下文愈来愈长、Agent影象愈来愈深、东西挪用愈来愈频仍的时辰,GPU的显存会被KV cache(影象缓存)撑爆,年夜模子的推理质量就会降落。

是以,推理发作的第 一个瓶颈,不是算力不敷,是”影象"及"计较"抢统一块显存。

对于国产GPU而言,算力(峰值 TFLOPS)不是最 年夜瓶颈,是显存。而英伟达GPU于显存技能上拥有领 先其他厂商1-2年的代际上风。

英伟达的主流数据中央GPU(如A100、H100)的单卡显存容量凡是标配为80GB,而最新一代Rubin GPU搭载8颗36GB的HBM4内存颗粒(总容量 288GB),显存总带宽晋升13 TB/s。

国产芯片受限在进步前辈制程,显存容量及带宽都更低,仍需突围。好比:昇腾910B的显存容量为64GB。

根据此前梁文锋发布的论文,此次DeepSeek-V4应采用了怪异的Engram架构,而Engram刚好解决的是显存容量瓶颈。

DeepSeek-V4的做法是,把模子里那些“死记硬违”的静态常识抽出来,塞进一个巨年夜的内存内外;推理时,CPU卖力“查字典”(检索常识),GPU只卖力“想逻辑”(计较推理)。

这二者是彻底堆叠履行的。当GPU于算上一个词的逻辑时,CPU已经经把下一个词所需的常识搬到了门口。因为延迟被这类并行架构完全袒护,AI单元时间内的产出效率呈几何级数晋升,GPU显存再也不被KV cache撑爆。

好比:一个需要80GB显存才能跑的长上下文推理使命,于Engram架构下,可能只需要8GB显存就能跑。

这象征着国产GPU于显存受限的环境下,也能完成一样的使命,而英伟达引以为傲的HBM显存稀缺性面对崩塌。同时,CPU也将迎来发作。

此外,更值患上存眷的是,DeepSeek-V4行将发布,此次没有按行业惯例给英伟达初期测试权限,把提早适配的时机全数留给了华为及寒武纪。方针是从CUDA生态总体迁徙到华为CANN框架。

虽然英伟达的CUDA生态短时间不会被代替,但已经经呈现了裂痕。这也象征着DeepSeek不管于开源生态还有是国产自立上依然有着其强力的生态位。

据媒体报导,为应答基在该模子云办事上线需求,阿里巴巴、字节跳动及腾讯等科技巨头已经提早下单华为新一代AI芯片,定单范围达数十万颗。

可以预感的是,此次行将发布的DeepSeek-V4,也将给AI投资带来新的预期。

新的投资预期

从投资角度看,妙投认为DeepSeek-V4将直接利好两年夜标的目的:国产算力和AI运用。

1.国产算力

假如DeepSeek-V4确认是彻底基在国产算力练习出来的,那这将是国产芯片史上的“DeepSeek时刻”。这证实了即便没有H100,咱们也能跑出生避世界一流的年夜模子。

这带来的边际变化是年夜超预期的。这个预期,不亚在Google依附自研的TPU芯片练习出Gemini。要知道,Google已经成为巴菲特的伯克希尔持仓标的。

此前,市场对于国产算力的预期年夜多逗留于“自立可控”的弘大叙事逻辑上,而V4将把逻辑推向“好用且必须”的贸易逻辑。

此次受益的最 年夜方,即是国产GPU厂商。华为、寒武纪已经经明牌了。其他国产GPU厂商也将踊跃适配DeepSeek年夜模子。从确定性来看,以华为、寒武纪为代表的国产芯片、国产办事器和相干配套厂商的受益确定性最高。

瞻望2026年,寒武纪、壁仞科技、天数智芯等5家已经上市AI芯公司Wind一致预期收入同比增加约120%到约257亿人平易近币。

此外,从弹性上来看,沐曦股分预期2026年将扭亏为盈,有望成为继寒武纪以后另外一家盈利的GPU厂商,从而实现贸易闭环。

是以,国产算力将为AI投资继承存眷的重点。

2.AI运用

除了了适配国产算力的推理需求,DeepSeek-V4可能经由过程立异架构(mHC及Engram技能)进一步降低练习及推理成本,加快中国AI价值链立异周期。

同时,DeepSeek有望帮忙全世界年夜语言模子及AI运用企业加快贸易化进程,从而减缓日趋极重繁重的本钱开支压力。

跟着Engram架构落地,GPU显存需求降低90%,推理的硬件成本会年夜幅压缩。这对于终端部署(边沿AI推理)是庞大利好。

此外,本年1月以来,A股AI运用板块体现低迷,焦点痛点是“年夜模子吞噬软件”的惧怕。AI运用已经经进入了“杀逻辑”的阶段。

但DeepSeekV4的发布可能改善这个情绪。对于在海内A股的运用公司来讲,年夜模子更像是一种廉价的基础举措措施,有益在优化成本。

妙投认为,与焦点数据绑定较为慎密的AI运用企业、相干云办事厂商,也将有望迎来边际改善。

小结

英伟达依旧是练习年夜模子最强的基础举措措施,这一点没有牵挂。短时间内,它于高端练习GPU、CUDA生态及集群能力上的上风,依然很难被替换。

不成轻忽,英伟达的上风正于慢慢被DeepSeek“曲线救国”式地崩溃。

DeepSeek-V4率先适配国产芯片以和立异正于试图证实,AI推理纷歧定只能靠最贵的GPU继承往前推,体系级优化、软硬协同及当地化部署,一样可以打开一条新路。而国产算力又能往前再走一步。

不要高估了英伟达,也不要低估了DeepSeek及国产算力。

【本文由投资界互助伙伴虎嗅网授权发布,本平台仅提供信息存储办事。】若有任何疑难,请接洽(editor@zero2ipo.com.cn)投资界处置惩罚。

-金年金字招牌(jinnian)今年会今年会2024

集团下属网站

集团下属网站

公众号

扫一扫关注金年金字招牌(jinnian)今年会今年会2024

苏ICP备09099908号-4 版权所有:今年会今年会2024控股集团有限公司