DeepSeek终于还是没憋住!_deep see

DeepSeek终于还是没憋住!

DeepSeek憋了这么久,原来不是放大招,而是偷偷打了个补丁。

3.1版,听着像修Bug,其实藏着几个能让日常用起来更顺的小改动。

先说最直观的:App里多了个“深度思考”开关。

打开,模型慢慢想,适合写方案、做数学题;关掉,秒回,适合闲聊、查天气。

一个模型两种性格,省得来回切账号,懒人福音。

速度也快了。

官方说少写20%-50%的废话,答案长度短一截,读起来像被剪辑过,重点都在。

省token就是省钱,API账单肉眼可见地瘦了一圈。

写代码的人可能更开心。

新模型在修Bug、跑终端任务上猛了一截,号称能跟Claude比划两下。

实际咋样得看项目,但至少报错信息不再像天书,改起来没那么痛苦。

搜索也升级了。

以前让它去网上抓资料,经常跑偏;现在跨学科问题也能拎出关键段落,少了很多“好像相关但又没用”的链接。

API这边,直接抄了Anthropic的格式,Claude那套工具链能无缝接进来。

128K窗口够塞下一整份标书,不用再分段上传。

开源照旧,Base和Chat全扔上HuggingFace。

但注意,分词器换了,老脚本得改两行,不然直接报错。

精度也换成FP8,N卡狂喜,A卡继续哭。

坏消息也有:夜间折扣没了,以后凌晨刷模型跟白天一个价。

钱包又要瘦。

至于万众期待的V4、R2,继续跳票。

多模态也没影,想让它看图说话,还得再等等。

总结一句话:这次更新像给老车换了套新轮胎,跑得更快更省油,但发动机还是那台。

急着用就升级,不急就再蹲。

原文链接:,转发请注明来源!