DeepSeek V4 消息整理

约 450 字大约 2 分钟

DeepSeek V4 大模型消息整理

2026-02-27

虽然 DeepSeek V4 还没有发布，但是大家最近估计已经被刷屏了。

什么“春节前后”、“最快下周”，什么“测试标准”、“模型参数”，现在又来了个 “Lite” 版本。

传的多了，搞的我都有点关注了，稍微整理下，方便同样吃瓜的小伙伴快速了解。

以下均为各种小道消息，仅供了解。

特性：

参数规模 2850 亿，。比 V3/R1 的 6710亿小，但考虑到是 Lite 版本，也能理解。
上下文直接从 126K 升级到 1M。虽然比不上 Gemini 3 的 2M，但也已经与第一梯队持平了。
原生支持多模态。这个是我最关注的，之前有一阵使用 DeepSeek 编程，逻辑什么都挺好，但是不能直接截图提问，非常难受。新版本如果原生支持，那提升还是很大的。

至于为什么没有按照之前惯例春节前就发布？

据称是因为，本次 DeepSeek 的新模型没有像往常一样提前给到“英伟达/AMD”进行早期访问，而是优先向“华为”等国内厂商提供了测试、适配机会。

这可是要直接解决“卡脖子”问题了，要是这样，再慢点我感觉也可以接受！

真心期望这次“国产模型”+“国产硬件”的组合不是传言，最好可以再次震惊世界~