金年金字招牌(jinnian)今年会今年会2024-DeepSeek再放大招，国产大模型坐不住了

　　首页财产ai正文 DeepSeek再放年夜招，国产年夜模子坐不住了 2025年1月后DeepSeek基本缄默沉静，4月24日推出V4预览版并开源。架构进级，推理端降价，百万token上下文成标配，还有将撑持华为算力，影响行业竞争格式。 2026-04-24 15:55 ·微信公家号：新眸李小东 AI投资人解读· DeepSeek V4总参数跃升至1.6万亿，技能是已往两年堆集的集年夜成，且从英伟达生态迁徙至华为昇腾芯片。其推理成本低，还有将百万token上下文设为标配并开源。 · 行业竞争激烈，云厂商转向多模子整合。DeepSeek面对繁杂场合排场，需于多方面取患上上风，其技能订价权长期性待察。总结：DeepSeek V4依附技能立异与成本节制揭示竞争力，虽面对挑战，但仍具投资潜力，其成长态势值患上存眷。内容由AI天生，仅供参考

DeepSeek V4上桌，牌局又变了。

已往一年多，年夜模子圈每一季度至少履历一次牌面重洗。有人于多模态端连出三张底牌，有人于Agent赛道一把梭哈，还有有人爽性掀了桌子，把模子拆成零件来卖。

但所有人都于等一小我私家出牌。

此人一年多没消息。2025年1月R1发布以后，他就像从牌桌上消散了。中间V3.一、V3.二、FlashMLA、DualPath这些零零星散的更新，充其量算于桌下换了一手牌，没人知道他手里到底攥着甚么。

4月24日，DeepSeek终究把牌撂下来了——V4预览版正式上线并开源，两个版本：V4-Pro及V4-Flash。

Pro对于标*闭源。Agent Coding模式下，内部测评体验优在Sonnet 4.5，交付质量靠近Opus 4.6非思索模式。世界常识测评年夜幅*其他开源模子，仅稍逊在Gemini Pro 3.1。数学及代码推理机能上，官方称“逾越当前所有已经公然评测的开源模子”。

Flash是轻量版，推理能力靠近Pro，但参数及激活更小，API相应更快，成本更低。两款都撑持百万token上下文——并且是标配。

问题来了：一家公司，于偕行疯狂赛马圈地的十五个月里基本缄默沉静，一脱手却直接把本身钉回了行业锚点，这申明甚么？

申明牌桌上的人底子没脱离过。他只是换了一种打法。

0一、架构的延续性革命

要理解V4，先患上回看V3。

2024年末，其时年夜模子行业的主流叙事还有是“参数越年夜越强”。练习一个年夜几千亿参数的模子，成本动辄万万美元起步。DeepSeek V3用6710亿总参数、每一次推理激活37B专家的MoE架构，把单次练习成本压到了500万美元出头。

不靠砍参数目，靠MoE路由计谋、DSA留意力机制及工程层面的*优化，说白了，把每一一分算力都花于刀刃上。

V4走的还有是这条路，但走到了更远之处。

技能规格上，V4完备版总参数跃升至1.6万亿，2850亿的Lite版作为更经济的选项。留意力机制进级为DSA2，整合了DeepSeek V3/R1中的DSA设计，同时引入本年初论文中提出的NSA稀少留意力方案。MoE体系启用Mega内核布局，每一层配置384个专家，每一次推理激活此中6个。残差毗连沿用Hyper-Connections方案，这条路于近期的DeepGe妹妹更新中已经有预演。

这些名词堆于一路，生手看着像天书，但业内子一眼就能读出寄义：V4是DeepSeek已往两年来所有技能堆集的集年夜成。

但最值患上存眷的变化，于在它的实现方式。

V4延期发布的真正缘故原由，不是甚么bug修不完，而是DeepSeek把整套体系从英伟达生态搬到了华为昇腾芯片上。

这不是换个驱动的事儿。DeepSeek R1昔时对于英伟达GPU的PTX底层做了*优化，这是它“花小钱办年夜事”的焦点竞争力。PTX是CUDA生态里的中间语言，深切到这层，才把其时能压榨的机能都压了出来。但转到华为昇腾以后，基在英伟达的所有工程堆集全数作废。整套底层代码、调理逻辑、工程系统，要重写一遍。

难度于哪里？年夜模子参数到达万亿级别以后，算力压力从“纯计较”转向了“体系调理与通讯”。DeepSeek V4虽然经由过程MoE降低了单次推理的计较量，但对于内存带宽、芯片间互联、KV Cache治理的要求反而更高了。

英伟达生态里，Hub上关在H100/B200经由过程NVLink构建高带宽互联的会商早已经证明，其单节点GPU间带宽可达TB/s级别。昇腾于这些指标上有较着差距，更多依靠光模块举行跨节点扩大，会引入分外的延迟及同步开消。软件层面，昇腾的CANN框架于算子笼罩、主动并行、内核交融等方面的成熟度，与CUDA生态仍不是统一个量级。

价钱就是时间。V4原规划本年夏历新年或者2-3月发布，一起推到4月才表态。按路透社的报导，V4将运行于华为最新的昇腾芯片上，工程师花了年夜量时间重写焦点代码。V4规划发布两个版本：完备版面向华为昇腾芯片，轻量版可于其他国产芯片上运行。

这件事的意义怎么夸大都不外分。已往两年，年夜模子世界建了一座巨年夜工场，所有的东西、标尺、流水线都是英文写的。你于这个工场里干活，就必需用他人的东西。英伟达CEO黄仁勋近期的反映很能申明问题，他说DeepSeek基在华为平台的新模子“对于美国来讲将是一个糟糕糕的成果”。这话从英伟达老板嘴里说出来，份量*不轻。

一旦有*模子于中国国产硬件上跑通了不变高效的推理，美国芯片的护城河就再也不安稳。而于4月24日的发布中，官方已经明确回应，V4于下半年将正式撑持华为算力。

0二、推理端最先降价，百万token的平权

架构的优化落到地面，看的是成本。而成本节制这件事，DeepSeek之前干过一次了。

2025年头，当各家年夜模子还有于拼练习端烧钱速率的时辰，DeepSeek V3用一套优化到*的MoE加DSA架构，把划一参数目级下的练习成本砍到了业内平均程度的几分之一。有评论称之为“练习端通缩古迹”。

但已往一年，AI行业的问题已经经从“怎么训出一个好模子”酿成了“怎么让好模子被用患上起”。2026年中国日均Token挪用量冲破140万亿，两年间涨了一千多倍。当挪用量以这个速率膨胀，推理成本就成为了*的命门。

V4于推理端做了两道减法。*道于架构层面:留意力机制从密集计较改成DSA2稀少留意力，Token维度直接做压缩。官方表述是“比拟传统要领，对于计较及显存的需求年夜幅降低”。第二道于精度层面：撑持FP4精度，对于显存的要求于FP8基础上再降一半。

路透社此前报导的推算也左证了效率节制的结果：V4每一个token仅激活约370亿参数，推理成本与V3连结于统一量级。参数目翻了不止一倍，推理成本却没涨。这象征着年夜到需要算力集群的企业，小到挪用API的创业者，都能于更年夜范围的模子上维持相近的预算。

而DeepSeek持久以来的订价也起到了降低门坎的作用。模子好用，用患上自制，挪用量天然连续增加。反过来连续分摊摊销研发投入，再鞭策更年夜范围模子的开放，形成一个正向飞轮。

这个逻辑已往一年于开源模子里跑通了不止一家，V4年夜几率是这条路上最新的加快器。

V4还有有一个轻易被轻忽的旌旗灯号：百万token上下文成为标配。

一年前，1M上下文还有是Gemini*的王牌，其他所有闭源模子遍及于128K或者200K之间，开源生态险些没人碰这个量级。DeepSeek没有把它包装成高端增值办事，而是明确公布从今天最先，V4所有官方办事的上下文默许都是1M。并且开源。

它的技能线路也注释患上很爽性。用一种全新的留意力机制于token维度上做压缩，同时共同DSA稀少留意力，直接把传统Attention的计较量及显存需求量削了下去，使患上模子处置惩罚1M上下文时的现实开消其实不比处置惩罚128K高几多，甚至可以纰漏不计。

此前的方案为了支撑长上下文，往往要追加内存、增长缓存层级。而V4把这条路走了个捷径，且已经经开放给所有人。

这象征着甚么？中小开发者用零门坎把整本《三体》塞进提醒词，法令合同阐发可以全文一次性送入模子，长周期多轮Agent挪用彻底免除影象压缩的魔改。

2025年，年夜模子行业的叙事还有是“能力平权”，开源模子追上闭源，各人都能用。2026年，叙事进一步延长，酿成“利用平权”，好模子不仅要追患上上，还有患上用患上起、用患上利便。

当把1M上下文及Agent能力同时开放，开发者的天花板一会儿被举高了许多。而这扇门打开以前，做Agent的团队光是处置惩罚超长上下文的影象治理就要花失一半精神。

0三、年夜厂的焦灼及各自的算盘

V4的发布会不是于真空中开的。牌桌上已经经换了不知道几轮玩家。

年夜厂这边，各家动作密集到了“每一周都有新工具”的水平。2026年马年春节先后，字节、阿里、腾讯、baidu四家累计投入超45亿元，以红包、免单、科技礼物等情势鞭策AI运用走向全平易近。

技能竞赛进入胶着状况。2月，阿里、字节、MiniMax密集发布新一代模子产物，MiniMax M2.五、Kimi K2.五、GLM-5等中国模子于OpenRouters上的Tokens耗损数已经排进全世界前三。

前不久，腾讯发布混元世界模子2.0，撑持二次编纂并直接导入Unity及UE引擎；阿里ATH事业部发布HappyOyster世界模仿器，撑持高保真动态场景天生。同月，京东摸索研究院开源自研的JoyAI-Image-Edit图象模子，切入了AI空间理解的焦点难题。

云厂商的模子计谋也从“押注一颗独苗”转向了多模子整合。“模子超市”各处着花，阿里云、baidu智能云、腾讯云都于把多家差别厂商的模子集中纳入统一平台，按需分发保举。这暗地里的逻辑很清晰，年夜模子正于从研发资产走向畅通商品，把握分发渠道比拥有单一模子的技能上风，市场回报更确定。

而DeepSeek面对的场合排场比一年前繁杂患上多。

2026年的Agent繁荣带来了Token耗损的狂欢，从OpenClaw到Hermas都于朝统一个标的目的使劲，把年夜模子挪用频次推向指数级更高。智谱、MiniMax等厂商依附海量的API挪用于推理端闷声发年夜财，甚至鞭策了阿里、智谱及MiniMax自身转向闭源。

当敌手的战役已经经推进到了多模态万能矩阵及营业深融的Agent生态时，单一的基座能力及文本推理已经经不足以组成护城河。V4再也不勒索点冲破的孤胆英雄，而是必需同时于开源模子基准、超长上下文易用性、推理成本节制以和国产硬件撑持等多个棋盘上取患上上风。

从发布成果看，V4交出的答卷确凿验证了它对于当下竞争核心的理解。而它面对的焦点磨练，实在已经经被精准归纳综合，“堆集的Prompt技巧，都是基在DeepSeek架构，那于必然水平上会增长开发者改换模子的成本，形成为了隐形的技能订价权”。

技能订价权的长期性，取决在V4发布以后的开源生态运营节拍及贸易模式的计谋纵深。

转头看，DeepSeek V3那一次，转变的是“练习成本”。其时行业共鸣是练习年夜几千亿参数的模子动辄几万万美元，DeepSeek用500万美元证实这个数字可以压缩一个量级。以后各家的练习成本预估一起走低，开源及闭源的成本基线被从头书写。

V4此次做的是另外一件事：它用万亿参数级的模子，把基准能力、百万级上下文及Agent能力同时打包、拆开、开源，向行业宣告——成本这一刀接下来砍向推理端。

这对于差别玩家的冲击是差别的。对于重注闭源的年夜厂来讲，压力于在竞争再也不只是机能对于标，而是开源社区把“水电煤”的价格压穿了以后，闭源要维持溢价变患上愈来愈坚苦。

从OpenAI到Anthropic，包括海内闭源巨头，面临Arch Lint的价格锚点，订价系统只会变患上史无前例的透明。对于在盯紧基础层算力供需的办事商来讲，当推理效率年夜幅提高、能效连续优化，整个算力需求的预期反而可能被从头上修。

更深一层的意义于在硬件生态。黄仁勋说“DeepSeek基在华为平台的新模子对于美国来讲将是一个糟糕糕的成果”，刚好点出了这轮AI竞争的焦点，从算法比拼转到体系工程能力比拼，再到硬件生态的绑定与突围。

V4会不会成为*个真正跑通国产算力闭环的万亿级年夜模子，此刻还有没有定论，但它于“去CUDA化”这条路上至少提供了一种可验证的参照系。

至在DeepSeek本身，融资、人材、贸易化，该面临的问题一个不会少。据上海证券报动静，DeepSeek已经启动建立以来初次外部融资，方针估值不低在100亿美元，规划筹集至少3亿美元。首代模子焦点作者之一罗福莉转投小米，R1焦点研究员、GRPO焦点发现者郭达雅插手字节跳动Seed。

年夜模子赛道的残暴于在，你必需于飞奔的列车上边换轮子边踩油门，停下来哪怕三个月，就可能被甩出牌桌。

DeepSeek停了一年多，这时期对于面的人一直于不断地发牌。此刻它终究亮出了本身的牌。只看一个开局，胜败还有远未到来，但有一点切当无误：这家公司的牌，从V3打到V4，不打散牌，一把王炸。

不管终极谁是赢家，这轮牌局的围不雅价值，远远赛过任何一个模子的跑分成果。

【本文由投资界互助伙伴微信公家号：新眸授权发布，本平台仅提供信息存储办事。】若有任何疑难，请接洽（editor@zero2ipo.com.cn）投资界处置惩罚。

-金年金字招牌(jinnian)今年会今年会2024

今年会今年会2024控股集团有限公司

金年金字招牌(jinnian)今年会今年会2024-DeepSeek再放大招，国产大模型坐不住了