今日上午,在小米2025人车家全生态合作伙伴大会上,xiaomi mimo大模型团队负责人罗福莉完成加盟小米后的首次公开亮相,并正式推出并开源全新moe架构大模型——mimo-v2-flash。


罗福莉随后在社交平台同步分享了关于MiMo-V2-Flash的核心技术细节:
MiMo-V2-Flash 已全面开放。这仅是我们通向通用人工智能(AGI)征程中的第二站,但其中若干关键工程决策,值得在此简要记录。
架构设计:
我们最终选定 Hybrid SWA(混合滑动窗口注意力)方案。该方案兼具简洁性与高效性,在内部长文本推理基准测试中,显著超越各类线性注意力(Linear Attention)改进版本。此外,固定 KV cache 的设计极大降低了与现有系统基础设施的集成门槛。
注:窗口长度设为128是经过充分验证的“更优值”(将窗口扩大至512反而导致性能下降);sink tokens 机制不可或缺,切勿省略。
MTP(多Token预测):
Sesame AI
一款开创性的语音ai伴侣,具备先进的自然对话能力和独特个性。
下载这一技术在当前高效强化学习(RL)实践中长期被低估。除首层外,MTP仅需极少量微调即可实现较高的 accept length。采用3层MTP结构后,我们在编程类任务中实测 accept length 稳定超过3,推理速度提升约2.5倍。
它有效缓解了小批量 On-Policy RL 场景下因长尾样本导致的 GPU 利用率低下问题。受限于本次发布节奏,MTP暂未嵌入完整 RL 训练流程,但其与 RL 框架天然契合。我们已将3层MTP模块完全开源,便于开发者即插即用。
基于MOPD的后训练策略:
我们引入 Thinking Machine 提出的 On-Policy Distillation(OPD) *** ,用于融合多个RL训练所得模型,计算效率跃升明显——仅需传统SFT+RL联合训练流程不到1/50的算力消耗,即可复现教师模型的全部能力。
此路径已初具雏形:学生模型持续迭代进化,终将反哺成为更强大的新教师,从而构建起自我增强的正向循环。
致谢:
致敬我所带领的这支卓越团队。他们在数月之内,将一系列前沿构想从纸面推至稳定可用的工业级系统。

来源:https://www.php.cn/link/f0e6cbab5a5b7ea2821b2fe1c39d624a
源码地址:点击下载
扫描二维码推送至手机访问。
版权声明:本文由2345好导航站长资讯发布,如需转载请注明出处。
扎根印制电路板技术研发二十年,专注于汽车电子、高频通讯等中高端领域的协和电子(605258)本周启动招股,下周四(11月19日)即将网上申购。 多年的沉淀,令其收获了一批优质客户。不过随着行业规模增长放缓、各类成本抬升以及行业龙头集中度提高,协和电子往日优势逐渐消退,利润水平也逐年降低,此...
以19%市占率位居精微屏蔽罩市场头部玩家的和林微纳,即将亮相科创板。 2021年3月9日,主要产品为微机电(MEMS)精微电子零部件的和林微纳,开启了科创板招股。公司与楼氏电子、瑞声科技、裕元电子和银河机械,一同成为精微屏蔽罩市场的主要玩家,2019年五家企业合计占到全球市场总份额的80%...
作为“光伏、风电”等大热门行业上游关键零部件供应商的新风光,即将登陆科创资本市场。 2021年3月24日,以大功率电力电子节能控制技术为核心技术平台,构筑电气控制装备产品体系的新风光,在科创板开启招股环节。 招股资料显示,新风光本次共计将募资5.9亿元,其中1.5亿元用于变频器和SV...
号称火电、核电行业凝结水精处理系统设备供应商最具竞争力之一的力源科技,即将登陆科创资本市场。 图/Wind 力源科技是一家主要为核电、火电、冶金、化工、石化等行业公司提供各类环保水处理系统和智能电站设备服务的企业。2021年4月21日,公司在科创板启动了招股环节,拟...
LED植物照明驱动电源第一股崧盛股份,即将亮相创业板资本市场。 2021年5月17日,深圳市崧盛股份披露《首次公开发行股票并在创业板上市招股意向书》及《初步询价及推介公告》等材料,启动IPO招股,距离正式登场仅剩一步之遥。 图/Wind 崧盛股份本次IPO拟募资4.59...
5月17日,肇民科技(301000.SZ)公告称,公司将首次公开发行股票并在创业板上市。本次发行数量 1333.35万股,发行价格为64.31元/股。 肇民科技是以特种工程塑料的应用开发为核心,专注于为客户提供高品质工程塑料精密件的制造商,主营业务为精密注塑件及配套精密注塑模具的研发、生产...