Qwen3 正式发布,目前最强的开源模型?无缝集成思考模式、多语言
2025-04-29
2 次阅读
会员专享
Qwen 3是 Qwen 系列中最新一代大型语言模型,提供全面的密集和混合专家 (MoE) 模型。旗舰模型Qwen3-235B-A22B在编码、数学、通用能力等基准测试中取得了与 DeepSeek-R1、o1、o3-mini、Grok-3 和 Gemini-2.5-Pro 等顶级模型相比极具竞争力。此外,小型 MoE 模型Qwen3-30B-A3B的激活参数量是 QwQ-32B 的 10 倍,即使是像 Qwen3-4B 这样的微型模型也能与 Qwen2.5-72B-Instruct 的性能相媲美。独特地支持单一模型内思维模式(用于复杂的逻辑推理、数学和编码)与非思维模式(用于高效、通用的对话)之间的无缝切换,确保在各种场景下实现最佳性能。推理能力大幅增强,在数学、代码生成、常识逻辑推理等方面超越了之前的QwQ(思维模式)和Qwen2.5指令模型(非思维模式)。卓越的人类偏好一致性,擅长创意写作、角色扮演、多轮对话和指令遵循,提供更自然、更具吸引力和身临其境的对话体验。精通代理能力,能够以思考和非思考两种模式与外部工具精准集成,在基于代理的复杂任务中取得开源模型的领先性能。支持 100 ...
🔒
登录后继续阅读
登录账号即可免费阅读本文
立即登录
还没账户? 注册
show = false, 3000)"
x-show="show" x-cloak x-transition
class="fixed top-20 right-4 z-50">