首页财产ai正文 方才,DeepSeek V4 双版本正式上线! 今天上午 DeepSeek API 文档上线,官方正式公布上线并开源「DeepSeek-V4 预览版」,先容其特征、立异点,还有宣布技能陈诉,昇腾平台下战书 4 点将直播首发。 2026-04-24 14:20 ·呆板之心存眷年夜模子的 AI投资人解读· DeepSeek V4 发布,有 DeepSeek-V4-Flash 及 DeepSeek-V4-Pro 两个版本,最年夜上下文长度 1M,于 Agent 能力等方面领先。采用混淆留意力架构等要害立异,于年夜量数据集预练习并优化。于推理 FLOPs 等方面显著削减,效率晋升。 · 依靠算力撑持,若国产算力供给变化或者影响模子成长语言模子竞争激烈,面对开源与专有模子两重竞争。 总结:DeepSeek V4 系列于语言模子效率上取患上进展,有技能上风与运用潜力,但需存眷算力供给和竞争态势,可联合行业成长评估其投资价值。内容由AI天生,仅供参考
终究,全世界 AI 圈等候了几个月的 DeepSeek V4,它终究来了!
今天上午,DeepSeek API 文档上线,让咱们看到了新版本的「庐山真脸孔」。
这次,DeepSeek V4 按巨细会有两个版本,别离是DeepSeek-V4-Flash 及 DeepSeek-V4-Pro。上下文长度各人此前已经经知道了,是 100 万 tokens。同时,输出长度*为 384K tokens。

就于方才,DeepSeek 官方正式公布上线并开源「DeepSeek-V4 预览版」。
开源链接:https://huggingface.co/collections/deepseek-ai/deepseek-v4
按照官方的先容,这次 DeepSeek-V4 于 Agent 能力、世界常识及推理机能上均实现海内与开源范畴的*。

两个版本,V4-Pro 与 V4-Flash 的*上下文长度均为 1M,且同时撑持「非思索模式」与「思索模式」,此中思索模式撑持 reasoning_effort 参数设置思索强度(high/max)。对于在繁杂的 Agent 场景建议利用思索模式,并设置强度为 「max」。

DeepSeek-V4 发布同时,也宣布了其具体的技能陈诉。

技能陈诉链接:https://huggingface.co/deepseek-ai/DeepSeek-V4-Pro/blob/main/DeepSeek_V4.pdf
该系列包括 DeepSeek-V4-Pro(1.6T 参数,49B 激活)及 DeepSeek-V4-Flash(284B 参数,13B 激活),二者均撑持一百万Tokens的上下文长度,旨于晋升超长上下文场景下的机能。该系列的要害立异包括:
1.混淆留意力架构:联合了 压缩稀少留意力(CSA) 及 高度压缩留意力(HCA),这一新要领显著削减了计较繁杂度,晋升了长上下文处置惩罚的效率,尤其合用在触及数百万Tokens的使命。
2.流形约束超毗连(mHC):加强了传统残差毗连,提高了旌旗灯号于层之间流传的不变性。
3.Muon 优化器:设计用在加快收敛及提高练习不变性,Muon 优化器显著晋升了练习历程中的模子机能。
4.练习及后练习管道:该模子于年夜量数据集(DeepSeek-V4-Flash 利用 32T Tokens,DeepSeek-V4-Pro 利用 33T Tokens)长进行了预练习,随后经由过程专门的练习及计谋蒸馏进一步优化,确保它们于推理、编程及世界常识使命中体现精彩。
5.长上下文效率:这些模子于推理 FLOPs 及 KV 缓存巨细 上都实现了显著削减,使患上处置惩罚一百万Tokens成为可能。例如,DeepSeek-V4-Pro 于与前代模子 DeepSeek-V3 的对于比中,FLOPs 降低了 73%,KV 缓存巨细削减了 90%。
6.评估成果:DeepSeek-V4-Pro-Max 版本于推理及常识使命上设定了新基准,逾越了以前的开源模子,并靠近一些专有模子的程度。DeepSeek-V4-Flash-Max 于更多高效的参数范围下,提供了相称的推理机能。
总的来讲,DeepSeek-V4 系列于年夜范围语言模子的效率上迈出了主要一步,可以或许有用处置惩罚超长序列,从而为繁杂的永劫间跨度使命斥地了新的可能性。
于另外一边,各人一直于体贴 DeepSeek V4 是否利用国产算力,成果也终究揭晓。以前就有报导 DeepSeek V4 新模子,将采用华为技能公司设计的最新芯片,也是真的。
咱们发明,昇腾 CANN 将于今全国午 4 点直播 DeepSeek V4于昇腾平台的首发。

值患上一提的是,寒武纪于软硬一体生态中,已经经完成基在 vLLM 推理框架完成对于 285B DeepSeek-V4-flash 及 1.6T DeepSeek-V4-pro 的Day 0 适配,适配代码已经开源到 GitHub 社区。
DeepSeek 官方于发布推文末了说道:「不诱在誉,不恐在诽,率道而行,端然正己。」出自《荀子・非十二子》,是一种超然,任工具南寒风的立场。
剩下的,就是各人亲自体验到 DeepSeek-V4 了!
【本文由投资界互助伙伴呆板之心授权发布,本平台仅提供信息存储办事。】若有任何疑难,请接洽(editor@zero2ipo.com.cn)投资界处置惩罚。
-金年金字招牌(jinnian)今年会今年会2024








