分享好友 最新资讯首页 最新资讯分类 切换频道
开源大模型得分新纪录!阿里千问3性能全球第三
2025-08-11 12:43

潮新闻客户端 记者 张云山

8月2日凌晨,国际权威大模型评测 Chatbot Arena更新了最新一期的大模型榜单,上周新鲜开源的阿里千问3新模型斩获1433分,超越顶尖闭源模型Grok4、Claude4,位列所有闭源及开源模型的全球总榜第三。同时,千问3还夺得数学、代码、复杂提示、长文本检索、指令遵循等5项全球第一。

图片

全球知名ChatBot Arena大模型排行榜,千问3位列全球顶级模型第三、开源第一(受访者供图)

Chatbot Arena是由独立研究机构LMSYS Org推出的大模型评测平台,其评测分数被认为是全球最具公信力的大模型榜单。

不到一年前,Qwen2.5-72B是第一个入选该榜前十的中国大模型;上周开源的千问3非思考基础模型 Qwen3-235B-A22B-Instruct-2507 再次实现重大突破,揽获5项关键能力全球第一,并以1433分的总分创下开源大模型的史上最高分,力压Grok4、Claude4、Gemini 2.5-Flash、GPT4.1等一众顶级闭源模型,千问3与GPT4.5并列全球第三。

图片

千问3在数学、代码、复杂提示、长文本、指令遵循等方面位列全球第一(受访者供图)

7月22日起,阿里通义团队接连开源千问3基础模型、AI编程模型和推理模型,性能均实现同类开源模型的新突破。除千问3 指令(Instruct)模型外,推理模型 Qwen3-235B-A22B-Thinking-2507 也闯进榜单前十,数学能力并列全球第一;在Chatbot Arena专门评估编程能力的WebDevArena子榜单中,编程模型Qwen3-Coder性能与Gemini2.5 Pro、DeepSeek-R1、Claude4并列第一。

图片

通义模型(受访者供图)

本周,通义千问仍在以“周级迭代”频率持续更新:Qwen3-30B-A3B 更新了Instruct模型、推理模型、编程模型等3款模型,性能媲美Gemini2.5-flash、GPT-4o,可在消费级硬件直接部署,广受开发者欢迎。

同时,千问3新模型的“训练秘籍”GSPO新算法也对外公开,GSPO从根源上解决了大规模MoE模型在强化学习中的稳定性问题,训练效率较经典GRPO算法实现大幅提升,GSPO论文在全球最大的AI开源社区HuggingFace里论文热度排名第一。

图片

阿里千问模型API调用量市场份额超10.9%,位列全球第四(受访者供图)

阿里AI多连发,在全球范围内引发新一轮接入中国开源模型热潮。

海外大模型API聚合平台OpenRouter数据显示,阿里千问模型全球市场份额逾10.9%,超越OpenAI和Meta-Llama系列模型,位列全球第四;其中,Qwen3-Coder调用量一周暴增1474%,位列编程领域的全球第二。

图片

编程领域中,Qwen3-Coder尤受AI社区欢迎,API调用量一周暴增1474%(受访者供图)

截至目前,阿里已开源300余个模型,持续推进“全尺寸”、“全模态”的全面开源。通义千问衍生模型已超过14万个,是全球第一的开源模型,也是中国企业用得最多的大模型。

未来三年,阿里巴巴还将投入3800亿元在AI和云基础设施建设上,夯实“AI全栈”的技术体系和战略布局,为全球开发者和企业提供更高性能、更普惠的AI和云计算服务。

最新文章
一周预告 | 美联储FOMC公布利率决议;美国众议院或将于5月6日听证会前公布加密货币监管草案
要闻预告:消息人士:美国众议院将于5月6日听证会前公布加密货币监管草案Shardeum将于5月5日进行TGE,即将公布空投及代币分配等
得不偿失!转发未婚妻出轨证据,出气之余需承担法律后果
博主的行为为何构成违法?《民法典》第一千零三十二条规定,自然人享有隐私权,任何组织或者个人不得以刺探、侵扰、泄露、公开等
西安2005年茅台酒回收价近期参考一览
另外给大家附上回收行情价格表50年9000元、30年3200元、15年400元、红皮铁盖1000元、路易十三2200元、生肖茅台鸡年、狗年、400元
竞逐小游戏:用户注意力的争夺之战
中经记者 许心怡 吴可仲 上海报道小游戏正成为全球各大平台争抢的新风口。近日,谷歌推出小游戏平台 Instant Games,收录了众多
无人拯救暴风
文章经授权转自公众号:猎云网(ID:ilieyun);作者: 盛佳莹和冯鑫接触过的人对冯鑫的评价多是:沉稳、不群、无为而治。看上去,冯
AI视频生成平台「拍我AI」开启6天限时免费
【TechWeb】9月5日消息,AI视频生成平台拍我AI宣布,今天10点起正式开启为期六天的限时免费活动——拍我AI免费开放日,持续至9月
西城新街口回收和天下苏烟大重九南京名烟酒
137=1888=0048路易十三,轩尼诗XO,轩尼诗李察,马爹利,芝华士,人头马,黑方,红方,蓝方,各种单瓶及礼盒。 红酒系列:拉菲,
17岁华裔小伙,给推文“算命”,5小时狂赚1万美金
推文算命,专治流量焦虑。一位17岁华裔小伙,直接给全世界自媒体人“上了一课”。这位名叫Eddy Xu的博主,在推特上发布了一款“
动漫中特别好看的6位精灵女主:芙莉莲实力强大,时崎狂三很邪恶
在二次元动漫的世界里,精灵一种非常常见的奇幻种族,大多数的动漫中,精灵都代表了好看与美好。下面,我们就一起来聊一聊动漫中
沧州市举行全市首贷续贷服务中心试点工作情况新闻发布会
7月18日,从沧州市政府新闻办举办的新闻发布会上获悉,截至6月末,全市首贷业务办理笔数1545笔,首贷金额28.86亿元;续贷业务办
推荐文章