当前位置:首页 > 站长资讯 > 正文内容

AI日报:阿里推多模态模型Qwen3-Omni;谷歌推出AP2协议;百度推出Qianfan-VL 模型

a811625535个月前 (09-23)站长资讯11

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现ai领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用

新鲜AI产品点击了解https://app.aibase.com/zh

1、阿里云推出全球首个全模态 AI 模型 Qwen3-Omni,实现文本、图像、音频与视频的统一处理

阿里云发布了 Qwen3-Omni,这是全球首个原生端到端全模态 AI 模型,支持文本、图像、音频和视频的统一处理。该模型在多个领域展现出跨模态的先进表现,并且已开源,能够满足全球用户的多语言需求。

【AiBase提要:】

Qwen3-Omni 是全球首个原生端到端全模态 AI 模型,支持文本、图像、音频和视频的统一处理。

模型支持119种文本语言和19种语音输入,能够满足全球用户的多语言需求。

️ 新发布的 Qwen-Image-Edit-2509 支持多图像编辑,显著提升编辑的一致性和效果。

详情链接:https://github.com/QwenLM/Qwen3-Omni huggingface:https://huggingface.co/collections/Qwen/qwen3-omni-68d100a86cd0906843ceccbe

2、告别P图烦恼!阿里Qwen-Image多图像编辑功能一键合成专业级广告大片

文章介绍了阿里巴巴旗下AI图像编辑工具Qwen-Image的重大功能升级,包括新增多图像编辑功能、引入ControlNet关键点地图技术以及扩展应用场景至模因 *** ,为电子商务和数字营销行业提供了更高效的解决方案。

【AiBase提要:】

️ 新增多图像编辑功能,支持人+人、人+产品、人+场景的灵活组合。

️ 引入ControlNet关键点地图功能,提升人物姿势控制精度。

扩展应用场景,支持模因 *** ,助力电商和营销行业。

详情链接:https://chat.qwen.ai/?inputFeature=image_edit

3、百度推出 Qianfan-VL 模型 多尺寸模型满足不同场景需求

百度智能云千帆团队推出了全新视觉理解模型 Qianfan-VL,该模型包括3B、8B 和70B 三种尺寸,针对企业级多模态应用进行了深度优化。Qianfan-VL 在OCR、教育场景和数学解题方面表现出色,并且在基准测试中展现了出色的通用能力和特定任务的优秀表现。

【AiBase提要:】

🧠 多尺寸模型满足不同场景需求

8B 和70B 模型具备思考推理能力

OCR 和文档理解表现优异

详情链接:https://baidubce.github.io/Qianfan-VL/

4、谷歌推出 AP2 协议,携手 PayPal 开启 AI 支付新时代

谷歌推出的AP2协议为AI支付提供了安全可靠的框架,通过授权令牌机制确保交易的合法性和安全性,同时与PayPal合作推动AI在支付领域的创新和应用。

【AiBase提要:】

AP2协议为AI支付提供安全授权机制,确保交易合法性。

🤝 谷歌与PayPal合作,推动AI在支付领域的实际应用。

授权令牌系统明确责任划分,提升交易透明度。

详情链接:https://github.com/google-agentic-commerce/AP2

5、苹果扩展图像生成平台:Image Playground 将引入更多第三方AI模型

苹果在 macos Tahoe26、iPadOS26 和 ios26 中对 Image Playground 进行了重大更新,引入了 chatgpt 作为图像生成模型,并计划支持更多第三方模型,如 google 的 gemini2.5Flash Image。

【AiBase提要:】

苹果扩展 Image Playground 支持更多第三方 AI 模型,包括 OpenAI 和 Google 的 gemini2.5Flash Image。

️ 新增“估计延迟”指标和“提供商标识符”,表明苹果正在优化模型选择机制。

苹果可能更倾向于与外部合作伙伴合作,而非直接支持开源模型,以确保图像生成工具的安全性。

6、一键变身学习机!百度搜索推出AI伴学

百度推出AI伴学,通过AI技术将普通手机转变为学习机,为学生提供精准练、口语训练等功能,助力教育公平和资源普及。

【AiBase提要:】

AI伴学通过AI技术将普通手机变为学习机,提升教育公平性。

️ 提供AI口语、作文批改等工具,助力学生个性化学习。

百度教育团队利用文心4.5等技术推动教育资源整合与普及。

7、钉钉AI表格助理正式上线:一句话生成表格,打造企业级AI应用平台

钉钉推出AI表格助理,将AI表格升级为面向AI时代的应用创建平台。用户只需更新到最新版本,即可体验这一新功能。AI表格助理支持自然语言描述想法,自动生成表格、自动化工作流和数据分析仪表盘,大大降低了使用门槛。

【AiBase提要:】

AI表格助理支持自然语言描述想法,自动生成表格、自动化工作流和数据分析仪表盘。

引入字段Agent,新增30款Agent,支持ai视频理解、数字人等多模态AI能力。

跨平台工作流支持,新增对百炼、Coze等平台工作流的支持,实现跨平台的数据汇总和分析。

8、DeepSeek-V3.1-Terminus 重磅发布:性能全面提升,深度推理能力显著增强

DeepSeek 发布了 DeepSeek-V3.1-Terminus 模型,并将其开源。该模型在原有基础上修复了语言不一致和异常字符问题,优化了编程和搜索智能体的性能。基准测试数据显示,其性能提升了0.2%至36.5%,尤其在高难度知识、多模态和深度推理方面表现突出。

【AiBase提要:】

🧠 DeepSeek-V3.1-Terminus 模型性能全面升级,提升幅度达0.2%-36.5%

重点优化了编程和搜索智能体的性能,解决了旧版的语言不一致问题

在 HLE 测试中表现尤为出色,展示了强大的深度推理与多模态处理能力

详情链接:https://huggingface.co/deepseek-ai/DeepSeek-V3.1-Terminus https://modelscope.cn/models/deepseek-ai/DeepSeek-V3.1-Terminus

9、Kimi Agent会员惊喜上线!打赏秒变9个月VIP,49元享超值AI深度研究

Kimi推出了全新的Agent会员服务,为早期打赏用户提供了额外的福利,同时通过音乐节拍命名的会员体系,展现了品牌创意。深度研究功能基于专有模型,提供专业洞见,推动了AI助手向智能化 *** 演进。

【AiBase提要:】

Kimi推出Agent会员服务,打赏用户可获得额外会员时长。

会员体系以古典音乐节拍术语命名,融合艺术与科技

深度研究功能基于专有模型,提供多维度观点分析和认知发现。

10、全球首个通用具身智能模型开源!智元机器人GO-1震撼来袭

智元机器人宣布其GO-1通用具身基座大模型全面开源,这是全球首个采用ViLLA架构的具身智能模型,能够理解和执行复杂任务。这一举措将推动具身智能的应用和研究,降低技术门槛,并吸引更多的开发者参与该生态系统,促进跨领域的创新与合作。

【AiBase提要:】

🤖 GO-1是全球首个采用ViLLA架构的具身智能模型,结合视觉、语言和潜在动作能力。

开源GO-1将推动具身智能的应用和研究,降低技术门槛。

智元机器人希望吸引更多开发者参与具身智能生态系统,促进跨领域创新与合作。

举报

扫描二维码推送至手机访问。

版权声明:本文由2345好导航站长资讯发布,如需转载请注明出处。

本文链接:http://www.2345hao.cn/blog/index.php/post/20104.html

分享给朋友:

“AI日报:阿里推多模态模型Qwen3-Omni;谷歌推出AP2协议;百度推出Qianfan-VL 模型” 的相关文章

高强度竞争领域注定容不下安逸,等待敲锣的协和电子正走在掉队的路上?

高强度竞争领域注定容不下安逸,等待敲锣的协和电子正走在掉队的路上?

  扎根印制电路板技术研发二十年,专注于汽车电子、高频通讯等中高端领域的协和电子(605258)本周启动招股,下周四(11月19日)即将网上申购。   多年的沉淀,令其收获了一批优质客户。不过随着行业规模增长放缓、各类成本抬升以及行业龙头集中度提高,协和电子往日优势逐渐消退,利润水平也逐年降低,此...

手握采购、研发、销售三条“命脉” 谁是操控创耀科技命运的神秘“公司A”

手握采购、研发、销售三条“命脉” 谁是操控创耀科技命运的神秘“公司A”

  1947年,美国贝尔实验室的威廉.肖克利和他的两位助手布拉顿、巴丁,研制出了世界上第一只晶体管,为集成电路产业打开时代大门,也造就了现代信息社会的根基――“芯片”。   但是现代信息社会并不能避不开国与国之间的问题。   “芯片强则产业强,芯片兴则经济兴,没有高端芯片就没有真正的产业安全和国...

威腾电气IPO观察:自夸“头部企业”被打回原形 拿投资者4个亿只为“试试水”?

威腾电气IPO观察:自夸“头部企业”被打回原形 拿投资者4个亿只为“试试水”?

  威腾电气,一家缺乏科创属性、爱夸夸其谈还带着问题供应商的公司,正在冲击科创板市场。   2021年1月14日,以输配电中母线产品研发、制造及销售为主业的威腾电气,正式通过上市委会议,距离科创板上市又近了一步。   但这对投资者而言,可能并不是一件好事。   由于身在传统电力行业,科研步伐又...

市占率不足0.1% 造血能力不足 罗普特科创上市谋续命?

市占率不足0.1% 造血能力不足 罗普特科创上市谋续命?

  钱流不进口袋的企业,真的算是赚钱企业吗?   盈利,是大部分投资者最关心的问题。但企业盈利的有效性,是有前提的,现金流就是这个前提。但这部分,往往会被许多投资者忽略,正如巴菲特的那句著名评论:“现金是氧气,99%的时间你不会注意它,直到它没有了”。   没有现金流入的盈利只是纸面数字,纸面数...

上声电子:四年净利仅剩30% 研发低产能又“空置” 三角股权难解丨

上声电子:四年净利仅剩30% 研发低产能又“空置” 三角股权难解丨

  历时四年发展,归母净利润反缩水近7成的上声电子,即将登陆科创板,寻求资本助力。   作为国内前装市场汽车声学产品方案供应商的上声电子,于2021年3月29日在科创板启动招股环节。公司计划募集4.47亿元资金,其中2.47亿元用于扩产扬声器项目,1.49亿元用于扩产汽车电子项目,剩余5000万元...

华恒生物:近半市占率的细分龙头 竟然只能“被动挨打”丨

华恒生物:近半市占率的细分龙头 竟然只能“被动挨打”丨

  全球最大的丙氨酸生产商华恒生物,即将亮相科创资本市场。   2021年4月7日,以合成生物技术为核心,主要从事氨基酸及其衍生物产品研发、生产、销售的华恒生物,于科创板开启了路演询价环节,距离正式亮相科创板仅剩一步之遥。      图/Wind   目前,华恒生物拥有接近50%的市场占有率...