快科技4月29日消息,今日,阿里云正式开源Qwen3系列模型,参数量为DeepSeekR1的1/3,成本大幅下降。
今晚,国家级算力服务平台超算互联网宣布,平台火速上线Qwen3全家桶,包含六个Dense模型:Qwen332B、Qwen314B、Qwen38B、Qwen34B、Qwen31.7B和Qwen30.6B;以及两款MoE模型:Qwen3235BA22B(2350多亿总参数、 220多亿激活参数),Qwen330BA3B(300亿总参数、30亿激活参数)。
Qwen3系列模型采用Apache2.0协议开源,开发者、企业可在超算互联网下载模型文件进行快速开发。
超算互联网表示,平台即将上线Qwen3系列模型镜像、应用空间快速体验服务,无需安装依赖,用户可0代码体验Qwen3系统模型对话服务,实现云端开箱即用。
据介绍,Qwen3235BA22B在编码、数学、通用能力等基准评测中表现出竞争力,能够与DeepSeekR1、o1、o3mini、Grok3和Gemini2.5Pro等模型媲美。
此外,小型MoE模型Qwen330BA3B以激活参数数量的10倍优势超越了QwQ32B,Qwen34B小型模型也能匹敌Qwen2.572BInstruct的性能。
【本文结束】如需转载请务必注明出处:快科技
责任编辑:拾柒