主页 > 新闻 > 全球热点 > 正文

Qwen3-Max-Preview— 阿里通义推出的最新旗舰模型

发布时间：

Qwen3-Max-Preview是阿里通义千问系列中最新推出的旗舰级超大型语言模型，于2025年9月5日-6日正式上线，参数量超过1万亿，是目前该系列中规模最大、能力最强的模型。其核心优势体现在以下方面：

一、核心能力升级

多维度性能增强
相较于2.5系列及此前的Qwen3-235B版本，该模型在中英文理解、复杂指令遵循、工具调用（如RAG检索增强生成）等方面实现显著提升，同时大幅减少知识幻觉，输出可信度与事实性更强，尤其适用于企业级应用场景。
强大的推理与任务处理能力
在多项权威基准测试中表现突出：
- 数学推理：AIME25测试获80.6分，展现高阶逻辑思维；
- 综合挑战：Arena-Hardv2基准测试领跑榜单，超越Claude-Opus4（Non-Thinking）、Kimi-K2等竞品；
- 编程与模拟：支持快速生成复杂程序（如小球碰撞模拟器、种群协作演化模型），可在几秒内完成需程序员数小时的开发任务，响应速度与准确性兼具。
多语言与工具优化
支持超过100种语言，强化翻译与常识推理能力，同时针对工具调用（Tool-calling）和检索增强生成（RAG）进行专项优化，虽未包含专门的“思考模式”，但在实际任务中能可靠嵌入企业流程，调用外部工具或数据库。

二、可用性与部署

多平台开放
目前已通过 QwenChat网页端（免费试用）和阿里云百炼API服务（商业调用）开放，开发者可直接体验或通过API集成至业务系统，计费采用按输入长度阶梯模式（如OpenRouter平台显示输入约8.6元人民币/百万tokens，输出约42.8元人民币/百万tokens）。
定位与生态策略
阿里将其定位为“模型即服务”（MaaS）的核心载体，兼顾C端用户体验与B端企业需求，支持复杂工作流处理、高质量开放式对话及智能代理（Agent）任务，可应用于客服、知识库检索、自动化流程等场景。

三、技术背景与行业意义

该模型是阿里推进“人工通用智能”（AGI）战略的重要一步，延续了Qwen3系列在混合架构、可控预算机制上的技术积累，并非单纯追求参数规模，而是通过模式切换与多模态兼容设计，实现万亿参数级模型的灵活商用落地。其推出进一步加剧了国内外大模型竞争，尤其在工具调用、企业级可靠性等实用维度树立了新标杆。

▋最新热点