首页 > 体育知识 > 体育知识 > DeepSeek V3.2爆火,Agentic性能暴涨40%解密

DeepSeek V3.2爆火,Agentic性能暴涨40%解密

发布时间:2025-12-04 21:17:32

DeepSeek V3.2的Agentic能力大增,离不开这项关键机制:Interleaved Thinking(交错思维链)。Interleaved Thinking风靡开源社区背后,离不开另一家中国公司的推动。

大模型的「健忘症」,早该治治了!

当你试图用当今最先进的大模型帮你完成一个复杂的长假规划,比如「带全家老小去云南玩七天」时,往往很可能会遭遇一个令人崩溃的时刻:

起初,这位「导游」表现得极其靠谱,分析得头头是道。

它记得你说的每一句要求,帮你规划了昆明到大理的路线,甚至贴心地避开了游客太多的网红店。

但随着对话进行到第十轮,你们为了选酒店修改了五次方案,又为了某顿晚餐争论了半天后,它突然「失智」了。

它开始忘记你一开始强调了无数遍的死命令:「带着80岁的奶奶,绝对不能安排爬山和剧烈运动」。

在最新的行程表里,它竟然兴致勃勃地建议:「第四天清晨:全家早起徒步攀登玉龙雪山,欣赏日照金山,全程耗时4小时……」

图片由Nano Banana Pro生成

在AI工程界,这种现象有一个术语:状态漂移(State Drift)

这并非模型「变笨」了,而是我们让它思考的方式错了。

为了治愈这种「健忘症」,Anthropic Claude、OpenAI GPT-OSS、MiniMax M2、Kimi K2 Thinking等国内外各大模型都不约而同地选择了同一项技术:一边思考,一边用工具(Thinking in Tool-Use)

DeepSeek: Thinking in Tool-Use

MiniMax等部分厂商也将其称作Interleaved Thinking(交错思维链),从示意图即可看出,二者本质上是等价的。这是一个更贴近技术的称呼。

Minimax: Interleaved Thinking(交错思维链)

如图所示,交错思维链即模型在推理(thinking)和工具调用(action)之间来回交替,并持续保留和复用每一轮的推理状态,从而实现稳定、可累积的长程规划。

崩溃的ReAct

与「隐式推理」的诅咒

要理解交错思维链为什么是「神技」,我们得先看看它的前任——早期的ReAct(Reasoning+Acting)范式是如何遇到瓶颈的。

ReAct流程示意图

在很长一段时间里,我们构建AI Agent的逻辑非常线性:观察->思考->行动。

这看起来很符合直觉,但在实际的工程实现(如OpenAI的Function Calling(函数调用))中,这个过程往往被简化成了「模型直接输出工具调用指令」。

问题就出在这里。

模型在输出Action(比如「读取文件A」)的那一刻,它的「脑子」是清醒的。

但当工具执行完毕,返回了数千行的代码或网页内容后,模型进入下一轮生成时,它面临着巨大的环境扰动

想象一下,你是一个程序员,每写一行代码,就有人把你打晕,清除你的短期记忆,然后把刚才的运行日志扔给你,让你继续写。

由于缺乏显式的、连续的思维记录,模型很容易被复杂的工具返回结果带偏。

它可能会被报错信息吸引注意力,从而忘记了原本的长期规划。

这就是「隐式推理」的诅咒。

模型的思考过程隐藏在权重里,一旦被打断(Turn-based interaction),这些思维火花就烟消云散了。

交错思维链:给Agent装上「海马体」

MiniMax的研发团队在开发M2模型时,敏锐地捕捉到了这个痛点。

Agent需要的不只是更长的上下文窗口,更是一种显式的、可累积的思考状态

这就是交错思维链

体育知识更多>>

27岁指挥官乃阿森纳之本!131场20球27助,有他在阿尔特塔很自信 曝前CBA外援布莱克尼打假球 23年3月打广东消极比赛 主场惨遭40分血洗! 广东不敌上海3连胜终结 关于皇家马德里新任主帅阿韦洛亚 你应该知道的五件事 被更衣室风暴冲掉的阿隆索:向上管理失败的经理人 U23国足3战0丢球“守”进淘汰赛 战乌兹“超级大巴”能否再创奇迹 四季度中国手机市场报告出炉:iPhone出货量飙升21.5%,位列第一 行业首款潮玩痛机亮相,荣耀500 Pro MOLLY 20周年限定版正式官宣 特斯拉将停售FSD买断版,全面转向订阅制模式 Claude版Manus只用10天搓出,代码全AI写的!小扎140亿像冤大头 荣耀WIN1954元!两千价打到240万分,五千旗舰冷了? “续航怪兽”荣耀Power2来了,主打户外轻旗舰 骁龙 8 Gen 5+6200尼特高亮屏!摩托罗拉moto Signature旗舰渲染图曝光 iPhone这些隐藏功能,真的让我感觉自己以前白用了 iPhone16系列参数已确定,8大升级,果粉直呼过瘾! OPPO在印度发布A6 Pro 5G:7000mAh电池配80W快充,主打长续航 7.2英寸巨屏,华为要搞游戏手机?Mate 80 GTS真的要来了? 增程界的天花板!新一代智己LS6大电池版冬季极限实测 开完林肯Z,再开朋友的蒙迪欧,对比后发现差距竟然如此明显! 极氪推送ZEEKR OS 6.7重磅升级:全域3D车道导航、全新ASD辅助驾驶上线 将“价格战”进行到底!丰田卡罗拉锐放跌至9.38万起,性价比真高 新轩逸搭1.6升动力/预计今年第一季度上市,全新日产轩逸实车曝光 2026大众迈腾 vs 凯美瑞:性能、设计、价格全解析 20万预算纯电轿车终极对决:小鹏P7+ vs 比亚迪汉EV 红旗固态电池实车测试启动,国标0.5%红线定真假 新轩逸搭1.6升动力/预计今年第一季度上市,全新日产轩逸实车曝光 续航可达630km!比亚迪全新轿车申报,轴距超2米8,又要火? 宝马多款车型官降,最高降幅30万,豪华车市场格局生变 宝马首款纯电轿跑SUV曝光! 全球换帅后,宝马更需要PLAN B?丨壹观察