北京时间11月18日,就在谷歌即将发布其新一代gemini模型的前夕,马斯克旗下的人工智能公司xAI,突然发布了其最新的大语言模型grok 4.1,正面硬刚谷歌与OpenAI。官方宣称,这款前沿模型在对话智能、情感理解等方面树立了新的标杆。马斯克本人也转发并表示,用户将会注意到其在速度和质量上的显著提升。

根据大模型竞技场(LMArena)最新公布的文本能力排行榜,Grok 4.1的两个版本已成功占据了榜首位置。其中,具备深度思考能力的Grok 4.1 Thinking版本以1483分的Elo分数高居之一,而非推理模式的Grok 4.1则以1465分紧随其后,位列第二。
官方表示,在为期两周的静默发布和盲测中,Grok 4.1在与前代模型的对比评估中,有64.78%的概率被用户偏好选择。
此次Grok 4.1更新的一个重要方向,是情感智能的提升,这与openai上周发布的gpt-5.1迭代方向不谋而合。xai官方表示,新模型能够更敏锐地感知用户的细微意图,沟通更顺畅,并保留了其敏锐的智能。在评估情绪智能的EQ-Bench测试中,Grok 4.1的两个版本同样包揽了榜单的前两名。
官方通过案例展示了Grok 4.1在处理情绪类问题时的进步。例如,当用户表达“想念我的猫,心都碎了”时,新模型的回复在细节和同理心上,都比前代模型更加丰富和真实。
Gaga
下载
在创意写作方面,新版本也表现出了更强的文学表达和戏剧张力。

除了情感智能,Grok 4.1在减少“幻觉”(即生成不符合事实的内容)方面也取得了显著进步。官方表示,在模型的后训练阶段,团队专注于减少信息检索提示中出现的事实性幻觉。数据显示,Grok 4.1的幻觉率已从前代的12.09%,大幅下降至4.22%,减少了近三倍。
为实现这些性能提升,xAI采用了创新的训练 *** 。他们开发了能够利用前沿的智能推理模型作为“奖励模型”的新 *** ,从而可以大规模地自主评估并迭代输出结果,优化模型的风格、个性与一致性。
大模型领域的竞争正愈演愈烈。在OpenAI刚刚更新其产品线、谷歌也即将发布其重磅新作之际,大模型竞技场榜首的位置是否会再次易主?一切都还是未知数。
扫描二维码推送至手机访问。
版权声明:本文由2345好导航站长资讯发布,如需转载请注明出处。
扎根印制电路板技术研发二十年,专注于汽车电子、高频通讯等中高端领域的协和电子(605258)本周启动招股,下周四(11月19日)即将网上申购。 多年的沉淀,令其收获了一批优质客户。不过随着行业规模增长放缓、各类成本抬升以及行业龙头集中度提高,协和电子往日优势逐渐消退,利润水平也逐年降低,此...
1947年,美国贝尔实验室的威廉.肖克利和他的两位助手布拉顿、巴丁,研制出了世界上第一只晶体管,为集成电路产业打开时代大门,也造就了现代信息社会的根基――“芯片”。 但是现代信息社会并不能避不开国与国之间的问题。 “芯片强则产业强,芯片兴则经济兴,没有高端芯片就没有真正的产业安全和国...
钱流不进口袋的企业,真的算是赚钱企业吗? 盈利,是大部分投资者最关心的问题。但企业盈利的有效性,是有前提的,现金流就是这个前提。但这部分,往往会被许多投资者忽略,正如巴菲特的那句著名评论:“现金是氧气,99%的时间你不会注意它,直到它没有了”。 没有现金流入的盈利只是纸面数字,纸面数...
作为“光伏、风电”等大热门行业上游关键零部件供应商的新风光,即将登陆科创资本市场。 2021年3月24日,以大功率电力电子节能控制技术为核心技术平台,构筑电气控制装备产品体系的新风光,在科创板开启招股环节。 招股资料显示,新风光本次共计将募资5.9亿元,其中1.5亿元用于变频器和SV...
历时四年发展,归母净利润反缩水近7成的上声电子,即将登陆科创板,寻求资本助力。 作为国内前装市场汽车声学产品方案供应商的上声电子,于2021年3月29日在科创板启动招股环节。公司计划募集4.47亿元资金,其中2.47亿元用于扩产扬声器项目,1.49亿元用于扩产汽车电子项目,剩余5000万元...
号称火电、核电行业凝结水精处理系统设备供应商最具竞争力之一的力源科技,即将登陆科创资本市场。 图/Wind 力源科技是一家主要为核电、火电、冶金、化工、石化等行业公司提供各类环保水处理系统和智能电站设备服务的企业。2021年4月21日,公司在科创板启动了招股环节,拟...