阿里千问3登顶全球最强开源模型,成本仅需DeepSeek-R1三分之一
创始人
2025-04-29 12:24:06
0

4月29日凌晨,阿里巴巴开源新一代通义千问模型Qwen3(简称千问3),参数量仅为DeepSeek-R1的1/3,成本大幅下降,性能全面超越R1、OpenAI-o1等全球顶尖模型,登顶全球最强开源模型。千问3是国内首个“混合推理模型”,“快思考”与“慢思考”集成进同一个模型,对简单需求可低算力“秒回”答案,对复杂问题可多步骤“深度思考”,大大节省算力消耗。

千问3采用混合专家(MoE)架构,总参数量235B,激活仅需22B。千问3预训练数据量达36T tokens,并在后训练阶段多轮强化学习,将非思考模式无缝整合到思考模型中。千问3在推理、指令遵循、工具调用、多语言能力等方面均大幅增强,即创下所有国产模型及全球开源模型的性能新高:在奥数水平的AIME25测评中,千问3斩获81.5分,刷新开源纪录;在考察代码能力的LiveCodeBench评测中,千问3突破70分大关,表现甚至超过Grok3;在评估模型人类偏好对齐的ArenaHard测评中,千问3以95.6分超越OpenAI-o1及DeepSeek-R1。性能大幅提升的同时,千问3的部署成本还大幅下降,仅需4张H20即可部署千问3满血版,显存占用仅为性能相近模型的三分之一。

千问3性能图

千问3还提供了丰富的模型版本,包含2款30B、235B的MoE模型,以及0.6B、1.7B、4B、8B、14B、32B等6款密集模型,每款模型均斩获同尺寸开源模型SOTA(最佳性能):千问3的30B参数MoE模型实现了10倍以上的模型性能杠杆提升,仅激活3B就能媲美上代Qwen2.5-32B模型性能;千问3的稠密模型性能继续突破,甚至像 Qwen3-4B 这样的小模型也能匹敌 Qwen2.5-72B-Instruct 的性能。

同时,所有千问3模型都是混合推理模型,API可按需设置“思考预算”(即预期最大深度思考的tokens数量),进行不同程度的思考,灵活满足AI应用和不同场景对性能和成本的多样需求。比如,4B模型是手机端的绝佳尺寸;8B可在电脑和汽车端侧丝滑部署应用;32B最受企业大规模部署欢迎,有条件的开发者也可轻松上手。

千问3开源模型家族

千问3为即将到来的智能体Agent和大模型应用爆发提供了更好的支持。在评估模型Agent能力的BFCL评测中,千问3创下70.8的新高,超越Gemini2.5-Pro、OpenAI-o1等顶尖模型,将大幅降低Agent调用工具的门槛。同时,千问3原生支持MCP协议,并具备强大的工具调用(function calling)能力,结合封装了工具调用模板和工具调用解析器的Qwen-Agent 框架,将大大降低编码复杂性,实现高效的手机及电脑Agent操作等任务。

相关内容

热门资讯

喜报丨鄂城区首届主题网络评论大... 荆楚网(湖北日报网)讯(记者 刘璐)5月24日,鄂城区首届以“武昌鱼故里 诗画乡愁地”为主题网络评论...
“笔墨传道”!江汉教育文化润心... 荆楚网(湖北日报网)讯(记者何鹏 通讯员徐祎)笔墨见道,画解玄思。5月23日下午,一场别开生面的规范...
理性看待中美日内瓦经贸会谈成果   近日,中美双方团队在瑞士日内瓦就美国对全球滥施“对等关税”政策及对我加征非理性高额关税展开对等磋...
乌克兰称基辅遭导弹和无人机袭击... 基辅遭袭 乌克兰首都基辅当地时间5月24日凌晨传出爆炸声。基辅市市长称当地遭俄方空袭,防空系统正在运...
“两新”政策效应显现 有效激发...   央视新闻客户端消息(新闻联播):各地加力扩围实施“两新”政策以来,通过优化流程、扩大范围、完善配...
5148.3万件、1432.6...   央视网消息:记者5月23日从商务部了解,截至5月22日,已经有4884.4万名消费者购买手机等数...
直达格鲁吉亚 中欧班列(武汉... 湖北日报讯(记者刘洁、通讯员徐晨)5月24日,中欧班列(武汉—霍尔果斯—波季/第比利斯)从中铁联集武...
“三链融合”激发动能,武汉大健... 荆楚网(湖北日报网)讯(记者 郑一鸣 通讯员 刘海东、刘光磊)5月22日,武汉市大健康产业链党委揭牌...
全球连线|从安第斯到喜马拉雅:...   近日,在上海援藏力量的组织下,一支来自阿根廷萨尔塔省的青年足球队,与雪域高原的青少年们在西藏日喀...
湖北又有2人荣获全国道德模范,... 极目新闻记者 李晓梦 陈倩5月23日,全国精神文明建设表彰大会在京召开,湖北2人被授予第九届全国道德...
老人花近3万元买400多瓶清洁... 近日,有消费者反映,家中老人遭遇“上门免费清洗”骗局,花近3万元买了400多瓶清洁剂,如果一个月用一...
祖坟挖出3公斤金砖?官员被曝找... 据“清风黔江”微信公众号5月20日发布的信息,经批准,黔江区监委对重庆黔江云之源足疗养生馆负责人王成...
厂商挺价意愿强烈!光伏产业链价... 光伏产业链价格在连续多周下行后,出现缓和迹象。中国有色金属工业协会硅业分会发布的数据显示,本周多晶硅...
法治精神润校园 洪山十二小师生... 荆楚网(湖北日报网)讯(记者何鹏 通讯员曾海鹰、董建丽)2025年5月是全国第五个“民法典宣传月”,...
好评中国丨守护“千年瑰宝”,传...   □何竹梅  5月19日,习近平总书记考察洛阳龙门石窟,了解当地加强历史文化遗产保护利用、推动文旅...
无人机执法,成都首批城管“飞行... 5月23日上午,成都市城市管理行政执法总队民用无人驾驶航空器操控员训练结业仪式在四川翔彭智航二号基地...
筑牢应对风雨的强大底气   “经济顶住压力稳定增长,延续向新向好发展态势”——  国家统计局近日发布4月份国民经济运行情况。...
小城大业 | “为他人作嫁衣”...   丁集,安徽六安的一个小镇,却是中国最大的婚纱礼服生产和销售基地之一,每年生产销售近500万件婚纱...
半挂车为逃避追查侧翻,司机多处... 极目新闻记者 舒隆焕5月23日中午,知情者张先生向极目新闻记者反映,今年4月16日,辽宁沈阳康平县交...
近2000张废旧彩票折成心愿树... 极目新闻记者 周萍英通讯员 张乐昕 李海洲 杨露露陶片黏成炫彩花瓶,毛线拼贴出风景画,这些看似稀松平...