5个回答

通义千问更新 Qwen3 升级版,性能超越Kimi K2 和 DeepSeek V3,有哪些技术亮点?

cqygfxgfst
90个点赞 👍

在与开发者朋友们持续交流和深入思考后,我们更新了非思考模式(Non-thinking)的旗舰版Qwen3模型,升级推出新模型Qwen3-235B-A22B-Instruct-2507,并同步开源其FP8版本。

新的Qwen3模型,通用能力显著提升,包括指令遵循、逻辑推理、文本理解、数学、科学、编程及工具使用等方面,在GPQA(知识)、AIME25(数学)、LiveCodeBench(编程)、Arena-Hard(人类偏好对齐)、BFCL(Agent能力)等众多测评中表现出色,超过Kimi-K2、DeepSeek-V3等顶级开源模型以及Claude-Opus4-Non-thinking等领先闭源模型。


此外,本次更新的Qwen3模型,还增强了以下关键性能:

-在多语言的长尾知识覆盖方面,模型取得显著进步。

-在主观及开放性任务中,模型显著增强了对用户偏好的契合能力,能够提供更有用的回复,生成更高质量的文本。

-长文本提升到256K,上下文理解能力进一步增强。

详细跑分可见下表:


这次发布的模型更聪明,知道更多,能做更多任务,尤其在代理类任务中表现更佳,我们诚邀您亲自体验!

模型体验和下载:

Qwen Chat:chat.qwen.ai(默认即为新模型)

Hugging Face:<br/>https://huggingface.co/Qwen/Qwen3-235B-A22B-Instruct-2507

huggingface.co/Qwen/Qwe

ModelScope 魔搭社区:<br/>通义千问3-235B-A22B-Instruct-2507

通义千问3-235B-A22B-Instruct-2507-FP8

模型评测结果请见 Hugging Face 模型卡:<br/>https://huggingface.co/Qwen/Qwen3-235B-A22B-Instruct-2507

更多重磅更新,敬请期待!
大家对本次 Qwen3 升级怎么看?欢迎在评论区留言或在话题下讨论,期待大家的反馈~

通义千问Qwen
自由评论 (0)
分享
Copyright © 2022 GreatFire.org