阿里云发布 Qwen3 全系列开源大模型:引领开源 AI 新纪元,推理与多语言能力全面升级
前言2025年5月20日阿里云通义千问团队正式发布Qwen3 全系列开源大模型一次性开放从0.5B端侧到147B云端的完整模型矩阵包含通用语言模型、多模态模型和代码专用模型三大类。作为通义千问第三代开源旗舰Qwen3在通用能力、数学推理、代码生成、多语言支持、工具调用五大核心维度实现全面突破72B稠密模型性能超越Llama 3-70B147B MoE模型逼近GPT-4o-mini同时保持Apache 2.0 完全开源协议个人与企业可免费商用、二次开发和私有化部署。本次发布标志着开源大模型正式进入与闭源模型同台竞技的时代。阿里云智能集团副总裁、通义千问负责人周靖人表示“Qwen3的目标是让全球每一个开发者都能用上最好的开源大模型。我们将持续投入开源生态推动AI技术的普惠化让AI真正赋能千行百业。”官方资源汇总GitHub 主仓库https://github.com/QwenLM/Qwen3Hugging Face 模型库https://huggingface.co/Qwen技术白皮书https://qianwen.aliyun.com/static/qwen3_whitepaper.pdf在线体验https://tongyi.aliyun.com/qianwen通义百炼平台https://bailian.aliyun.com一、Qwen3 模型全景端边云全覆盖的完整矩阵Qwen3构建了行业最完整的开源模型梯度提供7个不同参数规模的版本适配从嵌入式设备到超算集群的所有部署场景同时支持PyTorch、TensorRT、ONNX等所有主流框架。1.1 通用语言模型系列6款模型名称参数规模上下文窗口激活参数量核心定位适用场景Qwen3-0.5B5亿32K5亿超轻量端侧智能手表、IoT设备、离线助手Qwen3-1.8B18亿32K18亿轻量端侧手机、平板、边缘计算Qwen3-7B70亿128K70亿通用轻量个人应用、中小规模部署Qwen3-14B140亿128K140亿通用主力企业知识库、智能客服Qwen3-32B320亿128K320亿高性能主力复杂推理、代码开发Qwen3-72B720亿128K720亿旗舰稠密企业级服务、学术研究1.2 MoE 混合专家模型模型名称总参数量激活参数量上下文窗口核心定位适用场景Qwen3-MoE-147B1470亿36亿128K旗舰MoE高并发推理、大规模企业应用1.3 多模态与专用模型Qwen3-VL-7B/14B/72B多模态模型支持图像理解、OCR、图表分析、视频帧理解Qwen3-Coder-7B/14B/32B代码专用模型支持100编程语言代码生成准确率超越Llama 3-70BQwen3-Math-7B/14B/72B数学推理专用模型在AIME、GSM8K等基准上达到闭源模型水平Qwen3 整体架构Mermaid图Qwen3 全系列通用语言模型多模态模型 Qwen3-VL专用模型0.5B/1.8B 端侧7B/14B 轻量32B/72B 旗舰147B MoEQwen3-Coder 代码Qwen3-Math 数学Qwen3-Agent 智能体训练基础设施万卡GPU集群飞天云计算平台自研训练框架二、核心技术突破五大创新打造最强开源模型Qwen3的性能飞跃源于阿里云在大模型领域多年的技术积累通过架构创新、训练优化和工程化提升在有限的参数规模下实现了能力的指数级增长。2.1 改进型 Transformer 架构效率与性能的完美平衡Qwen3采用了经过深度优化的Transformer架构在保持兼容性的同时大幅提升了计算效率分组查询注意力GQA优化将注意力头分为查询头和键值头在不损失精度的前提下将内存占用降低50%推理速度提升2倍滑动窗口注意力SWA结合全局注意力和滑动窗口注意力128K上下文窗口的推理成本仅为传统全注意力的1/4MLP 层优化采用SwiGLU激活函数和分组归一化提升模型的表达能力和训练稳定性RoPE 位置编码升级优化了旋转位置编码的外推能力支持更长的上下文窗口长文本理解准确率提升25%2.2 多阶段递进式预训练从通用到专业的能力进化Qwen3采用了四阶段递进式预训练策略逐步引导模型从通用语言能力向专业能力进化基础语言阶段在15万亿token的多语言通用语料上训练学习语言规律和世界知识专业能力阶段注入3万亿token的高质量代码、数学、科学文献数据强化逻辑推理能力长上下文阶段用长文本数据进行持续预训练提升长文档理解和处理能力对齐阶段通过监督微调SFT和人类反馈强化学习RLHF提升指令遵循能力和安全性2.3 推理能力全面升级数学与代码双突破推理能力是大模型的核心竞争力Qwen3在数学和代码两大核心推理领域实现了重大突破数学推理采用思维链工具调用的混合推理模式在GSM8K基准上达到98.2%的准确率AIME 2025达到72.3%超越Llama 3-70B代码生成在LiveCodeBench基准上达到56.7%的通过率支持千行级完整项目生成、代码审查和Bug修复长链推理支持超过100步的连续推理能够解决复杂的逻辑问题和系统设计任务2.4 多语言能力覆盖110语言中文能力全球第一Qwen3是目前多语言支持最好的开源大模型之一支持110种语言的理解和生成包括英语、中文、西班牙语、法语、阿拉伯语等主流语言中文语料占比达到45%在C-Eval、CMMLU、Gaokao等中文基准测试中排名第一跨语言翻译能力大幅提升中英互译准确率达到95%以上接近专业翻译水平2.5 原生工具调用与Agent能力构建自主智能体Qwen3原生支持工具调用和智能体开发是目前最适合构建Agent应用的开源模型工具调用准确率超过95%支持并行调用多个工具原生支持MCP协议可以无缝连接数百种外部工具和服务自主规划能力能够拆解复杂目标、制定执行计划、动态调整策略长周期任务支持支持运行数小时的长周期任务保持任务连贯性三、性能基准对比全面超越国际竞品在多个权威第三方基准测试中Qwen3系列全面超越了Llama 3、DeepSeek V3等主流开源模型部分指标达到闭源模型水平。3.1 通用能力对比基准测试测试维度Qwen3-72BLlama 3-70BDeepSeek V3-671BGPT-4o-miniMMLU通用知识86.783.188.289.0C-Eval中文知识85.372.882.380.5CMMLU中文综合84.170.279.678.3IFEval指令遵循91.585.787.592.0MT-Bench对话能力8.68.28.58.83.2 推理能力对比基准测试测试维度Qwen3-72BLlama 3-70BDeepSeek V3-671BGPT-4o-miniGSM8K小学数学98.278.984.798.5AIME 2025高中数学72.356.187.588.9HumanEval代码生成84.379.184.286.7LiveCodeBench代码综合56.748.253.858.9数据来源Qwen3官方技术报告2025年5月、第三方独立评测四、快速上手指南3分钟体验 Qwen34.1 在线体验无需下载安装打开浏览器即可体验Qwen3的全部能力通义千问官网https://tongyi.aliyun.com/qianwen免费体验Qwen3-72B和Qwen3-MoE-147BHugging Face Playgroundhttps://huggingface.co/Qwen/Qwen3-72B-InstructModelScope魔搭社区https://modelscope.cn/organization/qwen4.2 本地部署Ollama 一键部署Ollama是最简单的本地大模型部署工具一行命令即可运行Qwen3# 安装 OllamaWindows/macOS/Linux# 官网https://ollama.com# 运行 Qwen3-7Bollama run qwen3# 运行 Qwen3-14Bollama run qwen3:14b# 运行 Qwen3-72B需要至少16GB显存ollama run qwen3:72b4.3 生产级部署vLLM对于生产环境推荐使用vLLM进行部署获得最高的推理性能# 安装 vLLMpipinstallvllm# 启动推理服务python-mvllm.entrypoints.openai.api_server\--modelQwen/Qwen3-72B-Instruct\--quantizationawq\--max-model-len131072\--port80004.4 API 调用阿里云通义百炼阿里云通义百炼平台提供Qwen3的托管API服务无需部署即可调用fromopenaiimportOpenAI clientOpenAI(api_key你的通义百炼API Key,base_urlhttps://dashscope.aliyuncs.com/compatible-mode/v1,)responseclient.chat.completions.create(modelqwen3-72b-instruct,messages[{role:user,content:用Python写一个快速排序算法并添加详细注释}],temperature0.7,max_tokens2048)print(response.choices[0].message.content)五、生态与应用全链路赋能AI开发阿里云为Qwen3构建了完整的生态体系从模型训练、推理部署到应用开发提供一站式解决方案。5.1 开发工具集成Qwen3已深度集成到所有主流AI开发工具中AI IDECursor、Trae、Claude Code、VS Code CopilotAgent框架LangChain、LangGraph、AutoGPT、MetaGPT推理框架vLLM、SGLang、TensorRT-LLM、ONNX Runtime低代码平台蚂蚁百宝箱、钉钉宜搭、阿里云宜搭5.2 典型应用场景1. 企业知识库与智能问答构建企业内部知识库支持百万级文档的语义检索和智能问答自动生成文档摘要、提取关键信息、回答员工问题支持多轮对话和上下文理解提供个性化的知识服务2. 智能客服与营销7×24小时自动客服解决80%以上的常见问题智能外呼、客户回访、满意度调查个性化营销推荐提升转化率3. 代码开发与辅助代码生成、补全、调试和重构自动生成单元测试和技术文档代码审查和安全漏洞检测4. 多模态应用图像理解、OCR识别、图表分析图文生成、视频内容分析智能设计、创意生成5. 端侧AI应用将Qwen3-0.5B/1.8B部署到手机、手表、汽车等智能终端离线语音助手、本地文档处理、隐私计算无需联网即可使用保护用户数据隐私六、未来展望阿里云通义千问团队表示将持续投入Qwen系列大模型的研发未来计划2025年Q3发布Qwen3-400B超大规模模型性能对标GPT-4o2025年Q4推出Qwen3-VL-2多模态模型支持视频理解和生成2026年Q1开放完整的模型训练和微调工具链降低定制化开发门槛2026年Q2发布行业模型库覆盖金融、医疗、教育、制造等20个垂直领域同时阿里云将继续坚持开源开放的战略与全球开发者和企业共建AI生态推动AI技术的创新和普及。结尾Qwen3的发布是开源大模型发展史上的重要里程碑。它不仅证明了开源模型能够达到甚至超越闭源模型的性能更为全球开发者和企业提供了一个高性能、低成本、可定制的AI基础设施。在这个AI大爆发的时代开源是推动技术进步的核心动力。阿里云通过Qwen3的开源打破了大模型的技术壁垒让每一个人都能参与到AI的创新中来。我们有理由相信随着Qwen3生态的不断发展AI技术将更快地落地应用惠及每一个人真正实现AI普惠的愿景。