Skip to content

DeepSeek V4 消息整理

约 450 字大约 2 分钟

DeepSeekV4大模型消息整理

2026-02-27

虽然 DeepSeek V4 还没有发布,但是大家最近估计已经被刷屏了。

什么“春节前后”、“最快下周”,什么“测试标准”、“模型参数”,现在又来了个 “Lite” 版本。

传的多了,搞的我都有点关注了,稍微整理下,方便同样吃瓜的小伙伴快速了解。

以下均为各种小道消息,仅供了解。

特性:

  1. 参数规模 2850 亿,。比 V3/R1 的 6710亿小,但考虑到是 Lite 版本,也能理解。
  2. 上下文直接从 126K 升级到 1M。虽然比不上 Gemini 3 的 2M,但也已经与第一梯队持平了。
  3. 原生支持多模态。这个是我最关注的,之前有一阵使用 DeepSeek 编程,逻辑什么都挺好,但是不能直接截图提问,非常难受。新版本如果原生支持,那提升还是很大的。

至于为什么没有按照之前惯例春节前就发布?

据称是因为,本次 DeepSeek 的新模型没有像往常一样提前给到“英伟达/AMD”进行早期访问,而是优先向“华为”等国内厂商提供了测试、适配机会。

这可是要直接解决“卡脖子”问题了,要是这样,再慢点我感觉也可以接受!

真心期望这次“国产模型”+“国产硬件”的组合不是传言,最好可以再次震惊世界~