12月5日,火山引擎正式推出其新一代语音识别系统——豆包语音识别模型2.0。新版本在核心架构与技术能力上实现了显著升级。
据悉,该2.0版本大幅提升了系统的推理与理解能力。通过深度分析对话的上下文语境,其整体关键词的准确捕捉率较以往提升了20%。这意味着系统能够更精准地把握用户表达的真实意图。
此次升级的另一大亮点是引入了多模态识别技术。新系统不仅能处理音频信息,还能结合单张或多张图片等视觉信息进行综合判断,从而实现“既听声音,也看内容”的识别效果,进一步提高了文字转写的准确性。
豆包语音识别模型2.0支持多模态识别
在语种支持方面,新版模型的服务范围进一步扩大,新增了对日语、韩语、德语、法语等共计13种外语的精准识别能力,以满足更广泛的国际化应用需求。
模型支持13种外语识别
针对日常识别中的难点,2.0版本进行了专项优化。系统在处理专有名词、人名、地名、品牌名称以及容易混淆的多音字时,表现出更强的鲁棒性和准确性。
以一个具体场景为例:在讨论历史人物生平时,若用户提到“苏辙贬谪地筠(yún)州”,传统识别技术可能因同音字问题误判为“云州”或“郓州”。而新一代系统能够依据对话中关于“苏轼、苏辙”的背景信息进行逻辑推理,即使前文未出现“筠州”,也能准确锁定这一特定历史地名,实现精准识别。
本期ai日报聚焦多项AI领域进展:字节跳动推出StoryMem系统,提升AI生成视频角色一致性28.7%;月之暗面计划2026年推出多模态模型K2.1/K2.5;智能眼镜Pickle 1实现“无限记忆”与主动交互;清华与OpenBMB开源音频模型评测框架ultraEval-Audio;OpenAI押注语音交互,整合团队重构音频系统;开源工具Antigravity支持多账号切换,突破AI使用限制;元象开源面向泛娱乐场景的大模型XVERSE-Ent;苹果回应“国行版AI功能 *** ”传闻,提醒用户勿通过第三方强行激活。
它石智航开源了全球首个大规模真实世界具身多模态数据集WIYH,填补了高质量、可泛化、大规模真实世界数据的空白。该数据集采用以人为中心的新范式,破解了数据采集成本高、仿真数据迁移难等痛点,为具身基座模型实现Scaling Law提供了关键语料。WIYH数据集具备真实可靠、丰富多元、全面多模态、规模化等特征,并拥有海量数据,覆盖10余种核心场景全链路任务。它石还�
《每日邮报》报道,英国7岁边境牧羊犬哈维能记住220个玩具的名字,并按指令准确找回对应物品,被称为英国最聪明的狗狗”。 研究人员称,全球仅约10只狗具备类似能力,目前哈维已受到布达佩斯、朴次茅斯等多家天才犬”研究机构关注。 哈维的主人、52岁的艾琳休
,近日,英国7岁边境牧羊犬能记住220个玩具的名字引发热议。 据狗狗主人艾琳介绍,它能按指令准确找回对应物品,还被称为英国最聪明的狗狗”。 研究人员称,全球仅约10只狗具备类似能力,目前它已受到布达佩斯、朴次茅斯等多家天才犬”研究机构关注。 艾琳表示,从幼犬时期起,她就以游戏方式训练它识别单词。
不露脸,只出声,直播日均流水超200万元,一款周边爆卖20.6万元。 当团播还在卷生卷死的时候,纯靠声音的语音厅却悄悄拿下了一个300亿的市场,并捧出了“𝑇.赵太阳”“控”等拥有百万粉丝的语音圈顶流。 不久前,“𝑇.赵太阳”还以听潮阁传媒总裁的身份参与录制了抖音、湖北卫视联合呈现的综艺《我被有趣的工作包围了》。
商务合作 侵权投诉 广告服务 版权声明 ***
©CopyRight 2002-2020 CHINAZ.COM
扫描二维码推送至手机访问。
版权声明:本文由2345好导航站长资讯发布,如需转载请注明出处。
扎根印制电路板技术研发二十年,专注于汽车电子、高频通讯等中高端领域的协和电子(605258)本周启动招股,下周四(11月19日)即将网上申购。 多年的沉淀,令其收获了一批优质客户。不过随着行业规模增长放缓、各类成本抬升以及行业龙头集中度提高,协和电子往日优势逐渐消退,利润水平也逐年降低,此...
威腾电气,一家缺乏科创属性、爱夸夸其谈还带着问题供应商的公司,正在冲击科创板市场。 2021年1月14日,以输配电中母线产品研发、制造及销售为主业的威腾电气,正式通过上市委会议,距离科创板上市又近了一步。 但这对投资者而言,可能并不是一件好事。 由于身在传统电力行业,科研步伐又...
钱流不进口袋的企业,真的算是赚钱企业吗? 盈利,是大部分投资者最关心的问题。但企业盈利的有效性,是有前提的,现金流就是这个前提。但这部分,往往会被许多投资者忽略,正如巴菲特的那句著名评论:“现金是氧气,99%的时间你不会注意它,直到它没有了”。 没有现金流入的盈利只是纸面数字,纸面数...
以19%市占率位居精微屏蔽罩市场头部玩家的和林微纳,即将亮相科创板。 2021年3月9日,主要产品为微机电(MEMS)精微电子零部件的和林微纳,开启了科创板招股。公司与楼氏电子、瑞声科技、裕元电子和银河机械,一同成为精微屏蔽罩市场的主要玩家,2019年五家企业合计占到全球市场总份额的80%...
历时四年发展,归母净利润反缩水近7成的上声电子,即将登陆科创板,寻求资本助力。 作为国内前装市场汽车声学产品方案供应商的上声电子,于2021年3月29日在科创板启动招股环节。公司计划募集4.47亿元资金,其中2.47亿元用于扩产扬声器项目,1.49亿元用于扩产汽车电子项目,剩余5000万元...
瑞华泰,一家打破“卡脖子”材料高端PI薄膜的企业,日前正在做科创资本市场的最后冲刺。 2021年4月14日,专注于高性能PI薄膜领域技术自主研发的制造商瑞华泰,已经开启路演及询价环节,距离正式科创板资本市场仅剩最后一步之遥。目前,公司已建立了完整的PI薄膜研发和产业化的核心技术体系,成功进...