新闻

阿里推出开源模型QwQ-32B 性能媲美DeepSeek-R1满血版

2025-03-06阿里云

295阅

3月6日,阿里旗下通义千问Qwen推出最新的推理模型 QwQ-32B。这是一款拥有 320 亿参数的模型,其性能可与具备 6710 亿参数(其中 370 亿被激活)的 DeepSeek-R1 媲美。

QwQ-32B 在一系列基准测试中进行了评估,测试了数学推理、编程能力和通用能力。测试结果显示,QwQ-32B 的性能和DeepSeek-R1-671B以及o1-mini 不相上下。

1

通义千问表示,希望能够证明强大的基础模型叠加大规模强化学习也许是一条通往通用人工智能的可行之路。

其近期的研究表明,强化学习可以显著提高模型的推理能力。例如,DeepSeek-R1 通过整合冷启动数据和多阶段训练,实现了最先进的性能,使其能够进行深度思考和复杂推理。

目前,QwQ-32B 已在 Hugging Face和 ModelScope开源,并采用了 Apache 2.0 开源协议。

责任编辑:王力
读者评论 (0)
请您登录/注册后再评论