Qwen3 正式发布，目前最强的开源模型？无缝集成思考模式、多语言

Qwen 3是 Qwen 系列中最新一代大型语言模型，提供全面的密集和混合专家 (MoE) 模型。旗舰模型Qwen3-235B-A22B在编码、数学、通用能力等基准测试中取得了与 DeepSeek-R1、o1、o3-mini、Grok-3 和 Gemini-2.5-Pro 等顶级模型相比极具竞争力。此外，小型 MoE 模型Qwen3-30B-A3B的激活参数量是 QwQ-32B 的 10 倍，即使是像 Qwen3-4B 这样的微型模型也能与 Qwen2.5-72B-Instruct 的性能相媲美。独特地支持单一模型内思维模式（用于复杂的逻辑推理、数学和编码）与非思维模式（用于高效、通用的对话）之间的无缝切换，确保在各种场景下实现最佳性能。推理能力大幅增强，在数学、代码生成、常识逻辑推理等方面超越了之前的QwQ（思维模式）和Qwen2.5指令模型（非思维模式）。卓越的人类偏好一致性，擅长创意写作、角色扮演、多轮对话和指令遵循，提供更自然、更具吸引力和身临其境的对话体验。精通代理能力，能够以思考和非思考两种模式与外部工具精准集成，在基于代理的复杂任务中取得开源模型的领先性能。支持 100 ...

Qwen3 正式发布，目前最强的开源模型？无缝集成思考模式、多语言

登录后继续阅读

相关推荐

暗网到底藏了什么？普通人第一次进去会看到什么？暗网入口及搭建！完整揭秘｜零度解说

Qwen-Image 最新版正式开源！不限速不限词，本地生成更真实，实力对标 Z-Image！附本地部署教程

彻底解除封印！SSD 硬盘速度提升 45%！只需 3 个命令，让电脑起飞！

3 条命令解锁 SSD 隐藏性能！实测提速 45%，Windows 立刻起飞