
近日,摩尔线程正式推出 PyTorch 深度学习框架的 MUSA 扩展库新版本——Torch-MUSA v2.7.0。此次更新在功能整合、性能调优以及硬件适配方面实现了多项重要进展。
自v2.5.0版本起,Torch-MUSA 的版本号已与 PyTorch 主版本保持一致,方便开发者更直观地进行版本匹配与管理。本次v2.7.0版本进一步集成了muSOLver与muFFT等高性能计算库,显著提升了复杂算法任务的运行效率;同时新增对统一内存设备(Unified Memory)的UMM支持,有效改善了内存资源的利用效率。
此外,新版继续保持与最新MUSA SDK的兼容性,支持使用MUSA SDK 4.2.0至4.3.0及更高版本完成编译构建。截至目前,Torch-MUSA 已实现对超过1050个专属算子的支持,在系统整体性能和稳定性方面也得到持续增强。
新增功能
通过设置环境变量 export TORCH_USE_MUSA_DOUBLE_CAST=1,用户可启用 Float64 类型算子的动态降级机制,torch_musa 将自动采用 float32 进行实际计算,提升运算速度。
支持多 rank 并行加载与保存模型状态,大幅缩短检查点操作耗时。当前已实现分布式检查点的异步保存能力,进一步提升训练流程效率。
功能升级
HARPA AI
浏览器插件,chatgpt自动化助手,将Chatgpt集成到谷歌搜索
下载新增特性
算子拓展与性能改进
系统能力增强
未来,Torch-MUSA 将持续跟进 PyTorch 官方版本演进节奏,计划下个版本将支持 PyTorch 2.9.0,并持续推进性能调优与功能完善,致力于打造更加成熟、高效的基于 MUSA 架构的国产全功能GPU深度学习生态体系。
源码地址:点击下载
扫描二维码推送至手机访问。
版权声明:本文由2345好导航站长资讯发布,如需转载请注明出处。
扎根印制电路板技术研发二十年,专注于汽车电子、高频通讯等中高端领域的协和电子(605258)本周启动招股,下周四(11月19日)即将网上申购。 多年的沉淀,令其收获了一批优质客户。不过随着行业规模增长放缓、各类成本抬升以及行业龙头集中度提高,协和电子往日优势逐渐消退,利润水平也逐年降低,此...
1947年,美国贝尔实验室的威廉.肖克利和他的两位助手布拉顿、巴丁,研制出了世界上第一只晶体管,为集成电路产业打开时代大门,也造就了现代信息社会的根基――“芯片”。 但是现代信息社会并不能避不开国与国之间的问题。 “芯片强则产业强,芯片兴则经济兴,没有高端芯片就没有真正的产业安全和国...
威腾电气,一家缺乏科创属性、爱夸夸其谈还带着问题供应商的公司,正在冲击科创板市场。 2021年1月14日,以输配电中母线产品研发、制造及销售为主业的威腾电气,正式通过上市委会议,距离科创板上市又近了一步。 但这对投资者而言,可能并不是一件好事。 由于身在传统电力行业,科研步伐又...
LED植物照明驱动电源第一股崧盛股份,即将亮相创业板资本市场。 2021年5月17日,深圳市崧盛股份披露《首次公开发行股票并在创业板上市招股意向书》及《初步询价及推介公告》等材料,启动IPO招股,距离正式登场仅剩一步之遥。 图/Wind 崧盛股份本次IPO拟募资4.59...
作为国内“过滤分离”材料主要供应商之一的严牌股份,正在做创业板资本市场的最后冲刺。 2021年5月14日,专注于环保过滤材料的研发、生产和销售业务的严牌股份,向交易所递交了上市注册稿,距离登陆公开资本市场又近了一步。公司此次IPO拟募资5.9亿元,其中2.33亿元将投入高性能过滤材料生产基...
有人盯紧我们的菜篮子,也有人盯上我们的菜篮子。 作为社区买菜的“吃螃蟹的人”,每日优鲜正在抓紧在美股IPO冲刺,与友商“叮咚买菜”争夺第一家上市的社区电商,这个虚幻的ID。 报表烧穿,血快流干 初创公司烧钱是一种常态,互联网企业为了获得用户基数,又格外烧钱。烧钱的目标最终还是为...