腾讯正式发布其全新开源 ocr 模型 hunyuanocr,模型参数规模仅为1b。该模型基于腾讯自主研发的混元多模态架构,在多项行业标准的 ocr 任务中实现了 sota(state-of-the-art)性能突破。据官方介绍,hunyuanocr 采用“端到端”设计,所有功能模块可在单次前向推理中高效完成,显著提升处理速度与准确率。

HunyuanOCR 主要由三大核心部分组成:原生分辨率视觉编码器、自适应视觉适配机制以及轻量化的混元语言模型。与现有主流 OCR 模型不同,HunyuanOCR 实现了全流程端到端训练与推理,结合大规模应用导向数据和在线强化学习策略,展现出卓越的上下文理解与推理能力。
在复杂文档解析评测中,HunyuanOCR 以94.1分的成绩领先于谷歌 gemini-3-pro 等多个先进模型。其文字检测与识别能力覆盖广泛场景,包括常规文档、艺术字体、街景文字、手写体、广告语、票据内容等,在各类测试中均表现优异。在 OCR 综合测评中,该模型取得高达860分的总成绩,成为参数量低于3B级别中的领先者。
What-the-Diff
检查请求差异,自动生成更改描述
下载此外,HunyuanOCR 支持14种语言的翻译功能,在跨语言文本处理方面表现出色。模型能够对复杂电子文档进行精准还原,将扫描图像或拍照文本按阅读顺序结构化输出,并支持使用 LaTeX 格式表达数学公式、HTML 格式呈现复杂表格。
应用场景上,HunyuanOCR 可广泛用于多语种文档分析、票据关键字段提取、视频字幕识别及实时拍照翻译等任务,具备极强的实用价值与扩展潜力。
源码地址:点击下载
扫描二维码推送至手机访问。
版权声明:本文由2345好导航站长资讯发布,如需转载请注明出处。
扎根印制电路板技术研发二十年,专注于汽车电子、高频通讯等中高端领域的协和电子(605258)本周启动招股,下周四(11月19日)即将网上申购。 多年的沉淀,令其收获了一批优质客户。不过随着行业规模增长放缓、各类成本抬升以及行业龙头集中度提高,协和电子往日优势逐渐消退,利润水平也逐年降低,此...
钱流不进口袋的企业,真的算是赚钱企业吗? 盈利,是大部分投资者最关心的问题。但企业盈利的有效性,是有前提的,现金流就是这个前提。但这部分,往往会被许多投资者忽略,正如巴菲特的那句著名评论:“现金是氧气,99%的时间你不会注意它,直到它没有了”。 没有现金流入的盈利只是纸面数字,纸面数...
以19%市占率位居精微屏蔽罩市场头部玩家的和林微纳,即将亮相科创板。 2021年3月9日,主要产品为微机电(MEMS)精微电子零部件的和林微纳,开启了科创板招股。公司与楼氏电子、瑞声科技、裕元电子和银河机械,一同成为精微屏蔽罩市场的主要玩家,2019年五家企业合计占到全球市场总份额的80%...
作为“光伏、风电”等大热门行业上游关键零部件供应商的新风光,即将登陆科创资本市场。 2021年3月24日,以大功率电力电子节能控制技术为核心技术平台,构筑电气控制装备产品体系的新风光,在科创板开启招股环节。 招股资料显示,新风光本次共计将募资5.9亿元,其中1.5亿元用于变频器和SV...
全球最大的丙氨酸生产商华恒生物,即将亮相科创资本市场。 2021年4月7日,以合成生物技术为核心,主要从事氨基酸及其衍生物产品研发、生产、销售的华恒生物,于科创板开启了路演询价环节,距离正式亮相科创板仅剩一步之遥。 图/Wind 目前,华恒生物拥有接近50%的市场占有率...
瑞华泰,一家打破“卡脖子”材料高端PI薄膜的企业,日前正在做科创资本市场的最后冲刺。 2021年4月14日,专注于高性能PI薄膜领域技术自主研发的制造商瑞华泰,已经开启路演及询价环节,距离正式科创板资本市场仅剩最后一步之遥。目前,公司已建立了完整的PI薄膜研发和产业化的核心技术体系,成功进...