Qwen3-Max-Preview— 阿里通义推出的最新旗舰模型

发布时间:

Qwen3-Max-Preview是阿里通义千问系列中最新推出的旗舰级超大型语言模型,于2025年9月5日-6日正式上线,参数量超过1万亿,是目前该系列中规模最大、能力最强的模型。其核心优势体现在以下方面:

一、核心能力升级

  1. 多维度性能增强
    相较于2.5系列及此前的Qwen3-235B版本,该模型在中英文理解、复杂指令遵循、工具调用(如RAG检索增强生成)等方面实现显著提升,同时大幅减少知识幻觉,输出可信度与事实性更强,尤其适用于企业级应用场景。

  2. 强大的推理与任务处理能力
    在多项权威基准测试中表现突出:

    • 数学推理:AIME25测试获80.6分,展现高阶逻辑思维;
    • 综合挑战:Arena-Hardv2基准测试领跑榜单,超越Claude-Opus4(Non-Thinking)、Kimi-K2等竞品;
    • 编程与模拟:支持快速生成复杂程序(如小球碰撞模拟器、种群协作演化模型),可在几秒内完成需程序员数小时的开发任务,响应速度与准确性兼具。
  3. 多语言与工具优化
    支持超过100种语言,强化翻译与常识推理能力,同时针对工具调用(Tool-calling)和检索增强生成(RAG)进行专项优化,虽未包含专门的“思考模式”,但在实际任务中能可靠嵌入企业流程,调用外部工具或数据库。

二、可用性与部署

  1. 多平台开放
    目前已通过 QwenChat网页端(免费试用)和 阿里云百炼API服务(商业调用)开放,开发者可直接体验或通过API集成至业务系统,计费采用按输入长度阶梯模式(如OpenRouter平台显示输入约8.6元人民币/百万tokens,输出约42.8元人民币/百万tokens)。

  2. 定位与生态策略
    阿里将其定位为“模型即服务”(MaaS)的核心载体,兼顾C端用户体验与B端企业需求,支持复杂工作流处理、高质量开放式对话及智能代理(Agent)任务,可应用于客服、知识库检索、自动化流程等场景。

三、技术背景与行业意义

该模型是阿里推进“人工通用智能”(AGI)战略的重要一步,延续了Qwen3系列在混合架构、可控预算机制上的技术积累,并非单纯追求参数规模,而是通过模式切换与多模态兼容设计,实现万亿参数级模型的灵活商用落地。其推出进一步加剧了国内外大模型竞争,尤其在工具调用、企业级可靠性等实用维度树立了新标杆。

阅读全文
▋最新热点