字节跳动 seed 团队推出新一代形式化数学推理专用模型 seed prover 1.5,通过大规模的 agentic rl 训练,其推理能力和推理效率取得显著进步。相比上一代模型,seed prover 1.5 在 16.5 小时内,针对 imo 2025 的前 5 道题目生成了完整可编译验证的 lean 证明代码,换算成绩为 35/42,达到此前 imo 评分标准的金牌分数线。
更系统的评估中,Seed Prover 1.5 在完整的 Putnam 历史评估集上解决了 88% 的问题,在代表硕士数学难度的 Fate-H 和代表博士生数学难度的 Fate-X 评估集上,分别解决了 80% 和 33% 的问题,刷新了形式化数学推理模型在这几个评测集上的 SOTA 表现。

Seed Prover 1.5 针对 FATE-H 问题调用工具示例:

千面视频动捕
千面视频动捕是一个ai视频动捕解决方案,专注于将视频中的人体关节二维信息转化为三维模型动作。
下载
技术报告:https://arxiv.org/abs/2512.17260Lean
证明代码:https://github.com/ByteDance-Seed/Seed-Prover/blob/mAIn/SeedProver-1.5/Putnam2025.zip
源码地址:点击下载
扫描二维码推送至手机访问。
版权声明:本文由2345好导航站长资讯发布,如需转载请注明出处。
【科技号】12月26日消息,近日,知乎发布了小蓝星推荐“2019年度数码好物榜”,对2019年度高口碑耳机、手机、笔记本、相机、显示器等数码好物进行盘点。 此次“2019年度好物榜”以“知乎评分”为基础排序和筛选规则,结合评分行为及超过75万条评价数,覆盖时尚、数码、影视等30+品类、400+...
扎根印制电路板技术研发二十年,专注于汽车电子、高频通讯等中高端领域的协和电子(605258)本周启动招股,下周四(11月19日)即将网上申购。 多年的沉淀,令其收获了一批优质客户。不过随着行业规模增长放缓、各类成本抬升以及行业龙头集中度提高,协和电子往日优势逐渐消退,利润水平也逐年降低,此...
1947年,美国贝尔实验室的威廉.肖克利和他的两位助手布拉顿、巴丁,研制出了世界上第一只晶体管,为集成电路产业打开时代大门,也造就了现代信息社会的根基――“芯片”。 但是现代信息社会并不能避不开国与国之间的问题。 “芯片强则产业强,芯片兴则经济兴,没有高端芯片就没有真正的产业安全和国...
威腾电气,一家缺乏科创属性、爱夸夸其谈还带着问题供应商的公司,正在冲击科创板市场。 2021年1月14日,以输配电中母线产品研发、制造及销售为主业的威腾电气,正式通过上市委会议,距离科创板上市又近了一步。 但这对投资者而言,可能并不是一件好事。 由于身在传统电力行业,科研步伐又...
钱流不进口袋的企业,真的算是赚钱企业吗? 盈利,是大部分投资者最关心的问题。但企业盈利的有效性,是有前提的,现金流就是这个前提。但这部分,往往会被许多投资者忽略,正如巴菲特的那句著名评论:“现金是氧气,99%的时间你不会注意它,直到它没有了”。 没有现金流入的盈利只是纸面数字,纸面数...
以19%市占率位居精微屏蔽罩市场头部玩家的和林微纳,即将亮相科创板。 2021年3月9日,主要产品为微机电(MEMS)精微电子零部件的和林微纳,开启了科创板招股。公司与楼氏电子、瑞声科技、裕元电子和银河机械,一同成为精微屏蔽罩市场的主要玩家,2019年五家企业合计占到全球市场总份额的80%...