当前位置:首页 > 站长资讯 > 正文内容

DeepSeek V3.2 正式版:强化 Agent 能力,融入思考推理

a811625533个月前 (12-01)站长资讯2

两个月前,我们推出了实验性版本 deepseek-v3.2-exp,并收到了大量热心用户提交的对比测试反馈。截至目前,并未发现 v3.2-exp 在任何特定任务场景下显著弱于 v3.1-terminus,这充分验证了 dsa 稀疏注意力机制的技术优势。衷心感谢广大社区用户的积极参与与持续支持,你们的反馈为我们不断突破技术边界提供了宝贵动力。

今日,我们正式发布两款全新模型:

DeepSeek-V3.2DeepSeek-V3.2-Speciale

官方网页端、移动 app 及 API 接口均已切换至正式版 DeepSeek-V3.2,欢迎广大用户立即体验。而 Speciale 版本目前将以临时 API 形式开放,供研究机构和开发者进行性能评测与学术探索。

新模型的技术白皮书也已同步上线:

https://www.php.cn/link/32a2bacb528ea401c06b17376cad237e

推理能力登顶全球前列

  • DeepSeek-V3.2 的设计目标在于实现强大推理能力与高效输出长度之间的更优平衡,适用于日常问答、通用 Agent 任务等广泛场景。在多项公开推理基准测试中,其表现已达 gpt-5 同级水平,仅稍逊于 gemini-3.0-Pro;相比 Kimi-K2-Thinking 模型,V3.2 显著缩短了输出链长度,在保证准确率的同时大幅降低计算资源消耗与响应延迟。
  • DeepSeek-V3.2-Speciale 则致力于将开源模型的推理极限推向新高度,专注探索模型潜能边界。作为 DeepSeek-V3.2 的长思考增强版本,Speciale 融合了 DeepSeek-Math-V2 的定理证明架构,具备卓越的指令理解、严密数学推导与逻辑验证能力,在主流推理测评中性能比肩 gemini-3.0-Pro(见表1)。尤为突出的是,该模型已成功取得 IMO 2025(国际数学奥林匹克)、CMO 2025(中国数学奥林匹克)、ICPC World Finals 2025(国际大学生程序设计竞赛总决赛)及 IOI 2025(国际信息学奥林匹克)金牌成绩,其中 ICPC 与 IOI 表现分别达到人类参赛者第二名与第十名的水准。

提示:在处理极端复杂问题时,Speciale 明显优于标准版,但其 Token 消耗量更高,运行成本显著上升。当前 Speciale 仅面向科研用途开放,不支持工具调用功能,亦未针对日常对话或内容创作类任务做专项优化。

表1:DeepSeek-V3.2 与其他主流模型在数学、编程及通用领域评测集上的得分对比(括号内为估算总 Token 消耗)

让思考驱动工具使用

  • 有别于此前版本在“思考模式”下无法调用外部工具的限制,DeepSeek-V3.2 成为首个实现深度思考与工具调用深度融合的模型,同时支持在思考与非思考两种模式下调用工具。我们提出一种大规模智能体训练数据生成 *** ,构建了超过 1800 种复杂环境、涵盖 85,000+ 难解易验任务的强化学习数据集,显著提升了模型在真实场景中的泛化能力。

表2:DeepSeek-V3.2 与其他模型在智能体工具调用测评中的得分表现

  • 如表 2 所示,DeepSeek-V3.2 在各类 Agent 测评中创下当前开源模型更佳纪录,极大缩小了与闭源领先模型之间的差距。需要强调的是,V3.2 并未针对这些评测所用的具体工具集进行专门训练,因此我们相信其在实际应用中将展现出更强的适应性和扩展性。

示例展示通过 LobeChat 调用 DeepSeek-V3.2 的深度思考+工具调用能力,获得更精准详尽的回答结果

SciMaster

全球首个通用型科研AI智能体

下载

全面开源

  • DeepSeek-V3.2

HuggingFace 仓库:
https://www.php.cn/link/02b710980274801e7136781fffa997c9

ModelScope 页面:
https://www.php.cn/link/be8e18628d3b1e19f8f9eb2ae7d913ca

  • DeepSeek-V3.2-Speciale

HuggingFace 仓库:
https://www.php.cn/link/02b710980274801e7136781fffa997c9-Speciale

ModelScope 页面:
https://www.php.cn/link/be8e18628d3b1e19f8f9eb2ae7d913ca-Speciale

官网、APP 与 API 全面升级

目前,DeepSeek-V3.2 已成为我们主推的正式服务模型,官网网页端、移动端 App 以及 API 接口均已从之前的 DeepSeek-V3.2-Exp 升级为正式版 V3.2,调用方式保持不变。

此外,为支持社区开展评估与研究工作,我们临时部署了 DeepSeek-V3.2-Speciale 的 API 服务。开发者可通过设置以下地址访问该模型:

base_url="https://www.php.cn/link/c652aee4df4084c621a094692ee6f6c9"

该 API 服务价格维持现有标准不变,仅支持思考模式下的对话交互,暂不开放工具调用等功能,更大输出长度默认设为 128K,服务有效期截至北京时间 2025-12-15 23:59。

支持思考模式下的工具调用

本次 API 更新重磅引入了 DeepSeek-V3.2 在思考模式下对工具调用的支持。现在,模型可在多轮“思考—调用—再思考”的流程中逐步推进问题求解,最终输出更加完整准确的答案。下图为该模式下的 API 请求流程示意:

  • 在回答问题 1 的过程中(请求 1.1 至 1.3),模型经历了多次内部推理并触发工具调用后才返回最终答案。此过程要求用户将上一轮的思维链内容(reasoning_content)回传给 API,以便模型继续后续推理。
  • 当开启新的用户提问(请求 2.1)时,需清除之前的思维链记录,仅保留其余上下文发送请求。
  • 更详细的接入指南请参阅官方文档:
    https://www.php.cn/link/2706d952855897483572487456d4498d

DeepSeek-V3.2 的思考模式现已兼容 Claude Code 使用方式,用户可通过将模型名称指定为 deepseek-reasoner,或在 Claude Code CLI 中按 Tab 键激活思考功能。但请注意,当前该模式尚未适配 Cline、RooCode 等采用非标准工具调用协议的组件,建议在使用此类工具时仍选择非思考模式运行。

源码地址:点击下载

扫描二维码推送至手机访问。

版权声明:本文由2345好导航站长资讯发布,如需转载请注明出处。

本文链接:http://www.2345hao.cn/blog/index.php/post/35701.html

分享给朋友:

“DeepSeek V3.2 正式版:强化 Agent 能力,融入思考推理” 的相关文章

米动年报:2019人均日走7554步青年人步数垫底

米动年报:2019人均日走7554步青年人步数垫底

【科技号】 “日均走出7554步、青年人步数垫底、中年人BMI超标问题严重……”近日,华米科技 正式发布《2019年米动运动健康年报》,该报告根据小米运动千万级的大数据和15万份线上调研数据,从步数、睡眠、饮食等多个维度,分析了今年人们的运动健康状况。 报告显示,2019年小米运动用户日均行走75...

高强度竞争领域注定容不下安逸,等待敲锣的协和电子正走在掉队的路上?

高强度竞争领域注定容不下安逸,等待敲锣的协和电子正走在掉队的路上?

  扎根印制电路板技术研发二十年,专注于汽车电子、高频通讯等中高端领域的协和电子(605258)本周启动招股,下周四(11月19日)即将网上申购。   多年的沉淀,令其收获了一批优质客户。不过随着行业规模增长放缓、各类成本抬升以及行业龙头集中度提高,协和电子往日优势逐渐消退,利润水平也逐年降低,此...

威腾电气IPO观察:自夸“头部企业”被打回原形 拿投资者4个亿只为“试试水”?

威腾电气IPO观察:自夸“头部企业”被打回原形 拿投资者4个亿只为“试试水”?

  威腾电气,一家缺乏科创属性、爱夸夸其谈还带着问题供应商的公司,正在冲击科创板市场。   2021年1月14日,以输配电中母线产品研发、制造及销售为主业的威腾电气,正式通过上市委会议,距离科创板上市又近了一步。   但这对投资者而言,可能并不是一件好事。   由于身在传统电力行业,科研步伐又...

市占率不足0.1% 造血能力不足 罗普特科创上市谋续命?

市占率不足0.1% 造血能力不足 罗普特科创上市谋续命?

  钱流不进口袋的企业,真的算是赚钱企业吗?   盈利,是大部分投资者最关心的问题。但企业盈利的有效性,是有前提的,现金流就是这个前提。但这部分,往往会被许多投资者忽略,正如巴菲特的那句著名评论:“现金是氧气,99%的时间你不会注意它,直到它没有了”。   没有现金流入的盈利只是纸面数字,纸面数...

新风光:核心材料严重依赖进口 毛利率下滑市场“风光”不再 |

新风光:核心材料严重依赖进口 毛利率下滑市场“风光”不再 |

  作为“光伏、风电”等大热门行业上游关键零部件供应商的新风光,即将登陆科创资本市场。   2021年3月24日,以大功率电力电子节能控制技术为核心技术平台,构筑电气控制装备产品体系的新风光,在科创板开启招股环节。   招股资料显示,新风光本次共计将募资5.9亿元,其中1.5亿元用于变频器和SV...

上声电子:四年净利仅剩30% 研发低产能又“空置” 三角股权难解丨

上声电子:四年净利仅剩30% 研发低产能又“空置” 三角股权难解丨

  历时四年发展,归母净利润反缩水近7成的上声电子,即将登陆科创板,寻求资本助力。   作为国内前装市场汽车声学产品方案供应商的上声电子,于2021年3月29日在科创板启动招股环节。公司计划募集4.47亿元资金,其中2.47亿元用于扩产扬声器项目,1.49亿元用于扩产汽车电子项目,剩余5000万元...