2025年火山引擎MaaS市场份额近半:低价、Agent与飞轮效应驱动增长
中国MaaS市场竞争激烈火山引擎份额稳固AI云飞轮加速转动中国MaaS模型即服务市场正迅速扩大从狭小市场变为潜力业务增长点。市场调研机构IDC数据显示2025年中国企业级MaaS市场大模型调用量同比增长16倍达1941万亿Token2026年增速预计更快。2025年下半年中国云计算厂商、大模型公司纷纷入场投入更多资源提高MaaS业务优先级竞争激烈。常理而言新兴市场扩容后来者入场会稀释领跑者份额外界曾认为大模型API难形成黏性。然而IDC数据显示2025年火山引擎在中国MaaS市场份额稳固从上半年的49.2%提升至全年的49.5%下半年竞争激烈时不仅未被摊薄还扩大了领先优势中国公有云上每两个大模型Token就有近一个跑在火山引擎上。外界常将其归因于激进定价策略2024年5月火山引擎发布豆包大模型MaaS服务时价格降至较行业通用水平低99.3%。但单纯补贴无法解释其份额持续扩张其他厂商也压低价格。真正决定低价能否持续的是调用规模和推理工程能力。模型能力也很关键。MaaS市场扩容源于模型能力提升打开新场景如模型编程能力推动Vibe Coding和Agent走热视频生成模型用于短剧等制作放大Token消耗。这意味着MaaS更注重增量市场的速度竞争谁能更快将模型能力产品化提供性价比高的稳定服务谁就能承接新增场景并扩大份额。豆包系列模型能力不断迭代火山引擎在此基础上将积累的Token规模转化为竞争力包括更低推理成本、更高工程效率及围绕Agent运行的基础设施一个大模型时代的云计算飞轮正在成型。低价背后是规模和工程能力云计算是高固定成本、低边际成本行业前期需大量投入服务器等新增调用边际成本下降规模越大研发和基础设施投入越易摊薄。规模也会放大工程优化价值火山引擎总裁谭待曾举例说明。规模是火山引擎发力MaaS看重的变量要尽快做大Token调用量。为此火山引擎将Token消耗量作为核心指标调整销售团队业绩考核方式MaaS产品激励权重是传统云服务数倍。随着业务优先级提升火山引擎增加模型推理方向技术投入。MaaS成本主要看Token生成效率提升服务器利用率等可降低成本。谭待表示看到能靠技术降成本就决定一次降彻底。支撑火山引擎降价的关键技术是PD分离和KV Cache。PD分离将大模型推理的“理解问题”和“生成答案”拆开匹配算力单元KV Cache缓存历史状态节省显存带宽和推理成本。但这些技术依赖规模小规模调用时维护成本可能抵消算力节省。随着技术扩散行业Token价格趋同缺乏规模效应的跟随者对标低价会有成本压力甚至亏损。火山引擎调用规模大成本压力小有空间优化推理技术形成可持续低价能力。此外火山引擎还通过差异化定价和“节省计划”降低成本其市场份额和收入份额均排名第一但每个Token单价低于行业均值。需注意IDC统计不包括字节跳动内部业务产生的Token这些调用量虽不进入市场份额统计但影响火山引擎成本结构和工程效率。Agent让MaaS变成了基础设施生意OpenAI CEO山姆·阿尔特曼称AI下一阶段将从大模型返回文本或代码转向Agent在公司内部完成工作OpenAI还与AWS合作开发类似“虚拟同事”的产品。MaaS正从提供标准化模型接口变为企业基础设施黏性更强。企业Agent运行需要多种组件及与内部系统连接这也是大模型行业重视Agent Harness的原因。Harness指与基础模型配合的工程系统MaaS提供稳定模型能力Harness将推理变成可约束、可持续运行的工作流。云平台提供大模型服务方式改变如Anthropic与云厂商合作、OpenAI与AWS合作会将模型接口封装进云平台原生Agent环境。火山引擎产品演进也符合这一趋势提升MaaS竞争力的同时将大模型服务扩展为覆盖开发和运营Agent的基础设施。谭待表示火山引擎是国内首个推出全套Agent产品、简化Agent开发的开发者写提示词模型完成流程规划等环节。今年初火山引擎支援央视春晚活动时推出OpenClaw产品ArkClaw开源上下文数据库OpenViking。他们将“ArkClaw个人版”定义为“敏态Agent”验证有效能力后沉淀为“稳态Agent”对应2024年上线的Agent开发和运营平台HiAgent。到今年4月火山引擎上累计消耗万亿Tokens的企业从去年底的100家增长到140家大客户合作更深入。AI云飞轮开始转起来了商业分析中飞轮效应解释了AWS的成功规模摊薄成本降价吸引客户客户增长推动技术和服务迭代。火山引擎在AI时代建立类似飞轮但与传统云计算不同MaaS飞轮多了模型能力、Token使用方式、Agent场景和真实业务反馈。火山引擎飞轮第一层是模型能力、调用规模和推理成本的循环。字节跳动Seed团队为火山引擎提供第一梯队模型模型强则调用规模大规模大则能压低成本成本下降吸引更多客户只是计量单位变为Token。第二层飞轮来自真实场景反馈。字节体系内的业务和外部客户通过火山引擎使用大模型提供高频、复杂、真实的产品反馈反馈流向Seed模型团队和Agent团队帮助提升产品能力。Anthropic也提到Agent能力提升依赖多方面反馈。2025年火山引擎在中国MaaS市场份额接近一半是飞轮转动的阶段性结果。当前Agent热潮推高市场需求部分公司涨价火山引擎表示不跟进。这源于其对行业阶段的判断认为当前扩大调用规模、降低使用门槛、增加真实场景更重要让飞轮加速。正如谭待所说AI云竞争是马拉松现在的份额不代表终局“比速度更重要的是加速度”。