蚂蚁百灵正式发布面向真实复杂任务场景的万亿级旗舰思考模型 Ring-2.6-1T并开放限时一周免费体验。该模型在效果、速度与成本间取得更优平衡测评成绩显著。模型发布与目标蚂蚁百灵宣布 Ring-2.6-1T 正式发布其目标不只是追求模型的聪明程度更注重以合理推理成本在真实复杂工作流中稳定、高效完成任务。独特机制Ring-2.6-1T 引入可调节的 Reasoning Effort 机制支持 high 与 xhigh 两种推理强度。high 适合高频 Agent 工作流xhigh 面向高难任务。测评成绩在多项测评中Ring-2.6-1T 表现出色。PinchBench 得分 87.60显著高于竞品ClawEval 得分 63.82 位居前列Tau2-Bench Telecom 达到 95.32差距不足 1 分。其他测评亮点ARC-AGI-V2 得分 77.78与竞品处于同一水位AIME 26 得分 95.83接近头部模型GPQA Diamond 达到 88.27体现科学知识理解与推理能力。免费体验机会目前 Ring-2.6-1T 开放限时一周免费体验开发者可借此机会深入了解其性能。编辑观点Ring-2.6-1T 的发布为复杂任务场景带来新选择测评优势明显免费体验或吸引开发者关注有望在行业中争得一席之地。