DeepSeek终于还是没憋住!
DeepSeek憋了这么久,原来不是放大招,而是偷偷打了个补丁。
3.1版,听着像修Bug,其实藏着几个能让日常用起来更顺的小改动。
先说最直观的:App里多了个“深度思考”开关。
打开,模型慢慢想,适合写方案、做数学题;关掉,秒回,适合闲聊、查天气。
一个模型两种性格,省得来回切账号,懒人福音。
速度也快了。
官方说少写20%-50%的废话,答案长度短一截,读起来像被剪辑过,重点都在。
省token就是省钱,API账单肉眼可见地瘦了一圈。
写代码的人可能更开心。
新模型在修Bug、跑终端任务上猛了一截,号称能跟Claude比划两下。
实际咋样得看项目,但至少报错信息不再像天书,改起来没那么痛苦。
搜索也升级了。
以前让它去网上抓资料,经常跑偏;现在跨学科问题也能拎出关键段落,少了很多“好像相关但又没用”的链接。
API这边,直接抄了Anthropic的格式,Claude那套工具链能无缝接进来。
128K窗口够塞下一整份标书,不用再分段上传。
开源照旧,Base和Chat全扔上HuggingFace。
但注意,分词器换了,老脚本得改两行,不然直接报错。
精度也换成FP8,N卡狂喜,A卡继续哭。
坏消息也有:夜间折扣没了,以后凌晨刷模型跟白天一个价。
钱包又要瘦。
至于万众期待的V4、R2,继续跳票。
多模态也没影,想让它看图说话,还得再等等。
总结一句话:这次更新像给老车换了套新轮胎,跑得更快更省油,但发动机还是那台。
急着用就升级,不急就再蹲。
