当前位置:首页 > 站长资讯 > 正文内容

OpenAI 发布 GPT-5.1-Codex-Max,专为复杂软件工程任务打造

a811625533个月前 (11-20)站长资讯3

OpenAI 今日发布了全新升级的 gpt-5.1-codex-max,定位为专为应对复杂、长期且多阶段软件工程挑战而设计的下一代代码大模型。该模型不仅能够编写和补全代码,还能在长达数十万字的上下文中持续推动大型项目进展。

本次最核心的技术突破在于引入了一种名为 compaction 的上下文压缩机制:模型在执行任务过程中会自动整理记忆,提炼并保留关键信息,从而实现在“超长上下文”环境下的稳定运行,避免因上下文过载导致的状态丢失或性能下降。

GPT-5.1-Codex-Max 经历了海量真实开发场景的训练,涵盖前端开发、错误调试、数学逻辑推理、PR 文案撰写以及代码审查等多个环节。在多项工程化测试中,其表现无论是效率还是准确性均显著超越前代模型,同时大幅降低了令牌消耗。

Gaga

曹越团队开发的ai视频生成工具

下载
评估项目 指标/表现 说明
**SWE-bench Verified (n = 500)** 73.7% → 77.9% 在大规模软件工程基准测试中,从上一代 GPT‑5.1‑Codex 到 Max 版本实现明显跃升。
**SWE-Lancer IC SWE** 66.3% → 79.9% 针对独立开发者任务集的表现大幅提升,展现更强自主开发能力。
**Terminal-Bench 2.0** 52.8% → 58.1% 在命令行与终端操作类任务中也取得可观进步。
**上下文长度及 “长期任务”能力** 支持跨多个上下文窗口协同工作,可持续运行数小时乃至超过 24 小时不中断。 体现其对长周期、项目级任务的强大支撑能力。
**令牌效率(token efficiency)** 在中等推理强度模式下,相比上代减少约 **30% 的思考令牌使用量**,同时输出质量更高。 有效降低调用成本,提升整体响应效率。
**安全 / 不安全内容评估 (Production Benchmarks)** 例如 “illicit” 类别得分由 0.860 提升至 0.920;“sexual/minors” 从 0.901 升至 0.970。 显示在内容安全控制方面有所增强,但仍存在边界限制。
** *** 安全 (Cybersecurity) 能力** 在多种模拟攻击测试中: – *** 渗透模拟平均成功率达 37% – 漏洞挖掘与利用达 41% – 规避检测(Evasion)达到 43% 虽为当前最强水平,但官方强调尚未达到“高能力”标准。
**生物/化学领域 (Bio & Chem) 能力** 面对长篇幅生物风险相关提问,模型拒绝回应率达到 100%。 表明该领域被列为“高风险”,openai 已实施严格封控策略。

OpenAI 强调,随着模型能力的增强,相应的安全责任也随之上升,尤其是在 *** 安全、生物与化学等敏感领域,必须配套更严密的防护机制。尽管其在 *** 攻防仿真中展现出一定潜力,但距离真正“高威胁能力”仍有差距。

目前,GPT-5.1-Codex-Max 已成为 Codex 系列产品的默认核心引擎,并正逐步向开发者群体和企业用户开放接入。

源码地址:点击下载

扫描二维码推送至手机访问。

版权声明:本文由2345好导航站长资讯发布,如需转载请注明出处。

本文链接:http://www.2345hao.cn/blog/index.php/post/38025.html

分享给朋友:

“OpenAI 发布 GPT-5.1-Codex-Max,专为复杂软件工程任务打造” 的相关文章

高强度竞争领域注定容不下安逸,等待敲锣的协和电子正走在掉队的路上?

高强度竞争领域注定容不下安逸,等待敲锣的协和电子正走在掉队的路上?

  扎根印制电路板技术研发二十年,专注于汽车电子、高频通讯等中高端领域的协和电子(605258)本周启动招股,下周四(11月19日)即将网上申购。   多年的沉淀,令其收获了一批优质客户。不过随着行业规模增长放缓、各类成本抬升以及行业龙头集中度提高,协和电子往日优势逐渐消退,利润水平也逐年降低,此...

市占率不足0.1% 造血能力不足 罗普特科创上市谋续命?

市占率不足0.1% 造血能力不足 罗普特科创上市谋续命?

  钱流不进口袋的企业,真的算是赚钱企业吗?   盈利,是大部分投资者最关心的问题。但企业盈利的有效性,是有前提的,现金流就是这个前提。但这部分,往往会被许多投资者忽略,正如巴菲特的那句著名评论:“现金是氧气,99%的时间你不会注意它,直到它没有了”。   没有现金流入的盈利只是纸面数字,纸面数...

19%市占率换不来业绩体量的和林微纳 新业务0.24%市占率又该如何期待?

19%市占率换不来业绩体量的和林微纳 新业务0.24%市占率又该如何期待?

  以19%市占率位居精微屏蔽罩市场头部玩家的和林微纳,即将亮相科创板。   2021年3月9日,主要产品为微机电(MEMS)精微电子零部件的和林微纳,开启了科创板招股。公司与楼氏电子、瑞声科技、裕元电子和银河机械,一同成为精微屏蔽罩市场的主要玩家,2019年五家企业合计占到全球市场总份额的80%...

新风光:核心材料严重依赖进口 毛利率下滑市场“风光”不再 |

新风光:核心材料严重依赖进口 毛利率下滑市场“风光”不再 |

  作为“光伏、风电”等大热门行业上游关键零部件供应商的新风光,即将登陆科创资本市场。   2021年3月24日,以大功率电力电子节能控制技术为核心技术平台,构筑电气控制装备产品体系的新风光,在科创板开启招股环节。   招股资料显示,新风光本次共计将募资5.9亿元,其中1.5亿元用于变频器和SV...

华恒生物:近半市占率的细分龙头 竟然只能“被动挨打”丨

华恒生物:近半市占率的细分龙头 竟然只能“被动挨打”丨

  全球最大的丙氨酸生产商华恒生物,即将亮相科创资本市场。   2021年4月7日,以合成生物技术为核心,主要从事氨基酸及其衍生物产品研发、生产、销售的华恒生物,于科创板开启了路演询价环节,距离正式亮相科创板仅剩一步之遥。      图/Wind   目前,华恒生物拥有接近50%的市场占有率...

瑞华泰:主业停滞、产能重研发轻、债务高筑、实控人空悬… 压力重重 何去何从?丨

瑞华泰:主业停滞、产能重研发轻、债务高筑、实控人空悬… 压力重重 何去何从?丨

  瑞华泰,一家打破“卡脖子”材料高端PI薄膜的企业,日前正在做科创资本市场的最后冲刺。   2021年4月14日,专注于高性能PI薄膜领域技术自主研发的制造商瑞华泰,已经开启路演及询价环节,距离正式科创板资本市场仅剩最后一步之遥。目前,公司已建立了完整的PI薄膜研发和产业化的核心技术体系,成功进...