当前位置:首页 > 站长资讯 > 正文内容

上海AI企业发布全球首个混合架构开源模型

a811625539个月前 (06-20)站长资讯7

  科技日报记者 李均

  低成本推理与超长文本理解的创新之门,近日被我国一家AI企业敲开。连日来,这一科技创新事件在全球ai领域引发震动。

  6月17日凌晨,总部位于上海的AI独角兽企业MiniMax(上海稀宇科技有限公司),发布了自主研发的“全球首个开源的大规模混合架构推理模型”MiniMax-M1(以下简称M1)。M1支持100万token上下文窗口,训练成本仅为53.74万美元,约合380万元人民币,其长文本处理、写代码等核心性能填补了开源领域长上下文技术的空白,展现比肩甚至超越业界顶尖模型的实力。

  开源“新王”:较低成本训练出顶尖模型

  当前,AI发展迎来关键转折点,如同一场比赛进入下半场。大模型的竞争已经转变为算力、数据、应用场景等整个生态的竞争,而高效、低成本、强推理能力成为定义下一代AI创新的关键变量。“M1如同用经济型轿车的成本造出了豪华超跑。”“M1是我们眼中的性价比‘新王’。”互联网上,一些AI行业观察者给出这样的评价。

  作为国内“AI六小虎”之一的MiniMax,此次发布的M1大模型拥有巨大的成本优势,主要源于两大技术创新。一是采用闪电注意力机制为主的混合架构,使得模型在计算长的上下文输入以及深度推理时更加高效;二是运用cisPO强化学习算法,优化重要性采样权重,训练效率超越其他大模型。得益于CISPO的高效,M1模型的整个强化学习阶段仅使用了512块英伟达H800 GPU,耗时3周,成本仅为53.74万美元。MiniMax方面表示,这一成本“比最初的预期少了一个数量级”。

  相关技术报告也指出,在进行8万Token的深度推理时,M1所需的算力仅为国内另一款大模型的约30%;生成10万token时,推理算力只需要另一款大模型的25%,实现了“性能跃升、成本腰斩”的双重突破,为市场提供了一个高性能、低门槛的新选择。对此,资深人工智能专家、高级工程师丁成刚认为,MiniMax宣布在其自有的app和Web端,M1模型将保持不 *** *** 。当较低成本训练出顶尖模型,用户不用担心百万token上下文成为高昂服务,可以预见,M1或将会成为智能体时代的首选开源基座模型。

  技术“大考”:推动架构创新,实现性能超越

  行业观察人士认为,面对多个核心生产力场景,M1于同类模型中率先实现了技术突破与架构创新,它的核心竞争力在于,将线性注意力(LinearAttention)与标准Softmax注意力有机融合,形成独特的“闪电注意力”机制。这一设计让M1在保持长序列处理效率的同时,解决了纯线性注意力在信息检索上的固有缺陷。

  相关技术报告显示,在性能方面,MiniMax在业内公认的17个主流评测集上对M1进行了“检阅”。结果显示,M1表现亮眼,全面碾压开源界。尤其是在软件工程、长上下文理解以及工具使用等复杂且对生产力要求较高的场景中,M1展现出绝对实力。在SWE-bench基准测试里,M1-40k和M1-80k分别取得55.6%和56.0%的高分。凭借其百万级的上下文窗口,M1在长上下文理解任务中具有压倒性优势,不仅超越所有开源模型,还在部分指标上接近OpenAI o3和Claude4Opus,在全球范围内位居第二。

  在 *** 工具使用场景(TAU-bench)的评测中,M1不仅在所有开源模型中脱颖而出,还战胜了gemini-2.5Pro。此外,M1-80k在多数基准测试中的表现都优于M1-40k,表明增加计算资源对于提升模型性能有显著作用。在处理400页技术文档或10万行代码库时,传统模型需反复切分上下文,而M1可以做到整体消化、连贯推理,为智能体发展提供了开创性范例。

  “M1打破了‘算力+资本’的竞争模式,将对全球AI大模型市场产生深远影响。不过,对于更多AI领域企业来说,要从技术流派转向市场应用,以解决问题、实现任务为出发点,开拓医疗健康、旅游、传媒等领域垂直类应用场景,才能在AI的规模化应用方面拥有更多想象空间和发展机遇。”资深创投专家、江苏投资人中心秘书长吴峰认为。

扫描二维码推送至手机访问。

版权声明:本文由2345好导航站长资讯发布,如需转载请注明出处。

本文链接:http://www.2345hao.cn/blog/index.php/post/33120.html

分享给朋友:

“上海AI企业发布全球首个混合架构开源模型” 的相关文章

高强度竞争领域注定容不下安逸,等待敲锣的协和电子正走在掉队的路上?

高强度竞争领域注定容不下安逸,等待敲锣的协和电子正走在掉队的路上?

  扎根印制电路板技术研发二十年,专注于汽车电子、高频通讯等中高端领域的协和电子(605258)本周启动招股,下周四(11月19日)即将网上申购。   多年的沉淀,令其收获了一批优质客户。不过随着行业规模增长放缓、各类成本抬升以及行业龙头集中度提高,协和电子往日优势逐渐消退,利润水平也逐年降低,此...

手握采购、研发、销售三条“命脉” 谁是操控创耀科技命运的神秘“公司A”

手握采购、研发、销售三条“命脉” 谁是操控创耀科技命运的神秘“公司A”

  1947年,美国贝尔实验室的威廉.肖克利和他的两位助手布拉顿、巴丁,研制出了世界上第一只晶体管,为集成电路产业打开时代大门,也造就了现代信息社会的根基――“芯片”。   但是现代信息社会并不能避不开国与国之间的问题。   “芯片强则产业强,芯片兴则经济兴,没有高端芯片就没有真正的产业安全和国...

市占率不足0.1% 造血能力不足 罗普特科创上市谋续命?

市占率不足0.1% 造血能力不足 罗普特科创上市谋续命?

  钱流不进口袋的企业,真的算是赚钱企业吗?   盈利,是大部分投资者最关心的问题。但企业盈利的有效性,是有前提的,现金流就是这个前提。但这部分,往往会被许多投资者忽略,正如巴菲特的那句著名评论:“现金是氧气,99%的时间你不会注意它,直到它没有了”。   没有现金流入的盈利只是纸面数字,纸面数...

19%市占率换不来业绩体量的和林微纳 新业务0.24%市占率又该如何期待?

19%市占率换不来业绩体量的和林微纳 新业务0.24%市占率又该如何期待?

  以19%市占率位居精微屏蔽罩市场头部玩家的和林微纳,即将亮相科创板。   2021年3月9日,主要产品为微机电(MEMS)精微电子零部件的和林微纳,开启了科创板招股。公司与楼氏电子、瑞声科技、裕元电子和银河机械,一同成为精微屏蔽罩市场的主要玩家,2019年五家企业合计占到全球市场总份额的80%...

新风光:核心材料严重依赖进口 毛利率下滑市场“风光”不再 |

新风光:核心材料严重依赖进口 毛利率下滑市场“风光”不再 |

  作为“光伏、风电”等大热门行业上游关键零部件供应商的新风光,即将登陆科创资本市场。   2021年3月24日,以大功率电力电子节能控制技术为核心技术平台,构筑电气控制装备产品体系的新风光,在科创板开启招股环节。   招股资料显示,新风光本次共计将募资5.9亿元,其中1.5亿元用于变频器和SV...

瑞华泰:主业停滞、产能重研发轻、债务高筑、实控人空悬… 压力重重 何去何从?丨

瑞华泰:主业停滞、产能重研发轻、债务高筑、实控人空悬… 压力重重 何去何从?丨

  瑞华泰,一家打破“卡脖子”材料高端PI薄膜的企业,日前正在做科创资本市场的最后冲刺。   2021年4月14日,专注于高性能PI薄膜领域技术自主研发的制造商瑞华泰,已经开启路演及询价环节,距离正式科创板资本市场仅剩最后一步之遥。目前,公司已建立了完整的PI薄膜研发和产业化的核心技术体系,成功进...