首页 > 系统资讯

比预期还要高60% DeepSeek V4参数量有望达到1.6万亿

番茄系统家园 · 2026-04-17 12:30:30

本站4月17日消息,距离4月下旬没有几天了,DeepSeek V4大模型的发布牵动人心,昨天该公司研究人员突然更新了DeepGEMM算子库,被视为V4发不动的千兆｡

然而他们显然也预料到了外界的反应,更新之后还额外添加了一个说明,强调这次更新只与DeepGEMM开发相关,跟内部模型发布无关,就是说大家不要多想,这不代表着V4要发了｡

比预期还要高60% DeepSeek V4参数量有望达到1.6万亿

不过越是这样声明,越让大家对DeepSeek V4感兴趣了,因为DeepGEMM这波更新的亮点挺多,不可能跟V4大模型没关系｡

这次的更新除了支持了FP8_FP4混合算子及优化了对NVIDIA Blackwell的支持之外,架构上升级主要是Mega MoE及HyperConnection,其中Mega MoE有可能会带来MoE架构的一次重磅升级｡

Mega MoE的好处很多,网上有不少解释了,Gemini的解析暗示V4的激活专家数量会比V3的256个大幅提升,可能是数千个,如此一来显然会极大地提升V4的性能,同时又维持灵活性,不会对算力和显存有夸张的需求｡

比预期还要高60% DeepSeek V4参数量有望达到1.6万亿

更重要的一点,DeepGEMM这次的更新还暗示了V4大模型的参数量,网友表示单层MoE大约是25.37B,如果还是60层,那V4大概率是1.6T的大模型,再不济也是48层1.25T的大模型｡

对比之前V4是个1T万亿参数的传闻,1.6T参数量意味着比之前的预期还要高60%,那性能表现就非常值得期待了｡

万一1.6T没实现,1.25T参数量也会比当前V3的6700亿参数量翻倍,依然可以期待下表现,毕竟Mega MoE技术再做到数千个激活专家,那绝对是一次蜕变,改变MoE架构大模型发展的里程碑事件｡

比预期还要高60% DeepSeek V4参数量有望达到1.6万亿

免责声明：凡标注转载/编译字样内容并非本站原创，转载目的在于传递更多信息，并不代表本网赞同其观点和对其真实性负责。如果你觉得本文好，欢迎推荐给朋友阅读；本文链接： https://m.nndssk.com/xtzx/421241TnXpxx.html。

猜你喜欢

最新应用

TapTap V2.84.0 手机版

TapTap V2.84.0 手机版

软天空游戏盒应用

软天空游戏大全App

菜鸡游戏不用排队版

软天空游戏盒子手机版

软天空游戏盒正式版

软天空游戏盒子app

软天空游戏盒子App

软天空游戏

菜鸡游戏App

玩GO

好游快爆软件

菜鸡游戏

葫芦侠App

第五人格盒子软件

热门应用

快手大屏版

嘿咻漫画

快狐短视频

微信

钢琴助手手机版

钢琴助手最新版

2345游戏盒

北京交通app停车缴费

光环助手oppo版最新

精准天气预报几点几分

飞信

华为鸿蒙os2.0系统

messenger free

海棠书屋自由阅读的小说阅读网

QQ