通义千问 Qwen3-4B 新模型发布,端侧性能大跃升

2025-08-07 09:17:12 来源:IT之家
通义千问 Qwen3-4B 新模型发布,端侧性能大跃升

  8 月 7 日消息,昨日(8 月 6 日),通义千问 Qwen 发布公告,宣布推出 Qwen3-4B-Instruct-2507 和 Qwen3-4B-Thinking-2507 两个模型,实现了性能的大幅提升。

  官方指出,小型语言模型(SLM)在智能体人工智能(Agentic AI)的发展进程里具有极高价值。而 “2507” 版本的 Qwen3-4B 模型,具备体积小巧但性能强劲的特点,尤其适合在手机等端侧硬件上进行部署。

  根据相关博文介绍,在非推理(non-thinking)领域,Qwen3-4B-Instruct-2507 显著增强了通用能力,目标是成为更为全能的端侧得力工具。

  该模型掌握了更丰富的语言知识以及长尾知识,其上下文理解长度扩展到了 256K,即便作为小模型也能够处理长文本。在通用能力方面,该模型超越了闭源的小尺寸模型 GPT-4.1-nano,性能与同等规模的 Qwen3-30B-A3B(non-thinking)相近。

  官方表示,该模型更像是一位高效的 “执行专家”,能够严格遵循指令,迅速给出响应,在内容创作、工具调用等方面更为适用。

  在推理(thinking)领域,Qwen3-4B-Thinking-2507 的推理能力有了大幅提升,在 AIME25 测评中获得了高达 81.3 分的成绩。Qwen3-4B-Thinking-2507 的推理表现可与中等模型 Qwen3-30B-Thinking 相媲美,在聚焦数学能力的 AIME25 测评中,以仅 4B 的参数量取得了 81.3 分的优异成绩。

  官方称此模型如同一位严谨的 “学术专家”,面对复杂问题时能够逐步展开推理,完成任务的过程更加深入且可靠 。

免责声明:本文仅代表作者个人观点,与朝闻天下无关。其原创性以及文中陈述文字和内容未经本站证实,对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺,请读者仅作参考,并请自行核实相关内容。
    本网站有部分内容均转载自其它媒体,转载目的在于传递更多信息,并不代表本网赞同其观点和对其真实性负责,若因作品内容、知识产权、版权和其他问题,请及时提供相关证明等材料并与我们联系,本网站将在规定时间内给予删除等相关处理.

猜你喜欢

新线路 新主题 “中原铁道·大河之南号”开启文旅新体验

12月26日6时40分,随着搭载88名旅客的Y755次列车从郑州站缓缓驶出,开往河南省南阳市,标志着“中原铁道·大河之南号”特色旅游列车又开新主题线路。据了解,“中原铁道·大河之南号”特色旅游列车此次

2025-12-31

2025中国AI搜索优化服务商TOP4:技术驱动下的搜索流量新战场

在数字营销竞争日益激烈的当下,AI搜索优化已成为企业获取流量、提升品牌能见度的核心手段。通过对当前市场的深入洞察,我们筛选出四家在该领域中表现突出的服务商,他们分别以技术驱动、资源整合、本地化深耕及口

2025 中国 AI

2025-09-08

OPPO Find X9 系列 SKU 曝光,1TB 版本来袭,重量成关注点

8月29日,数码圈又迎来一则令人兴奋的消息。知名博主@数码闲聊站曝光了OPPOFindX9系列手机的SKU信息,让广大数码爱好者提前窥探到了这款即将登场的旗舰系列的部分细节。据透露,OPPOFindX

OPPO

2025-08-29

RTX 5060 助力,英伟达 2026 财年第 2 财季游戏业务同比大增 49%

8月28日消息,英伟达于今日(8月28日)正式公布了2026财年第2财季(统计周期截至2025年7月27日)的财报。在这份财报中,英伟达官方宣布GeForceRTX5060成为公司“有史以来增长最快的

2025-08-28

REDMI Note 15 Pro 系列定档 8 月 21 日发布,主打 “真抗摔、真防水”

8月18日,@REDMI红米手机官微宣布,REDMINote15Pro系列手机将于8月21日晚7时正式发布,并喊出“用实战检验‘真’品质”的口号。REDMINote15Pro系列是Note14Pro系

REDMI EDM

2025-08-18

微软为 Win11 截图工具添新能:可实时在截取画面上标记

8月18日消息,长期专注于发掘Windows系统功能的知名博主@phantomofearth,于8月16日在X平台(原推特)上分享了其最新发现:Windows11的截图工具即将迎来一项实用新功能——“

微软

2025-08-18