MCP协议的Token税争议暴露了更大问题：企业AI缺的不是

张

张建站

2026/5/12 13:56:37

10分钟阅读

最近AI圈有一件挺有意思的事。Perplexity——就是那个号称AI搜索引擎的产品——公开宣布要弃用MCP协议。原因很直接Token税太高了每次通过MCP调用一个工具中间都要经过大模型推理一次Token消耗像流水一样哗哗地往外流。这件事在圈子里炸开了锅。因为MCP可是被Claude的母公司Anthropic大力推广的一度被誉为AI世界的USB-C接口。 Anthropic的愿景很美好所有AI应用、工具、数据源都通过MCP这个统一标准连接起来互插互用就像USB-C统一了充电接口一样。但Perplexity的退场让很多人开始冷静下来——光有一个标准接口真的够吗一、MCP的初衷是好的但现实很骨感我们先理解一下MCP到底在解决什么问题。在AI应用开发中一个很常见的场景是你想让AI帮你查数据库、调API、读文档。这些外部工具怎么和AI大模型对接以前每个厂商各搞各的OpenAI有Function Calling百度有文心一言的工具调用各家协议不通开发人员头疼得很。MCP就是想统一这个事。它定义了一套标准协议任何工具只要按MCP规范封装好任何支持MCP的大模型就能直接调用。听起来很完美对吧但问题出在调用方式上。按照MCP的标准流程当用户说帮我查一下上个月的销售数据时AI不是直接去查数据库而是先用大模型理解用户的意图再通过MCP协议把调用请求发给对应的工具工具返回结果大模型再理解结果组织成自然语言回复你看第1步和第4步都需要大模型参与。也就是说每一次工具调用至少要消耗两次大模型推理的Token。如果工具调用过程中还有来回确认、参数校验Token消耗量会成倍增加。这就是Perplexity说的Token税——你为每一次操作都额外付出了大模型推理的成本。二、为什么Token税对企业来说是个大问题对于个人用户来说偶尔多花几个Token不算什么。但对于企业来说这就是另一回事了。举个例子。假设你的企业有一个客服系统每天要处理10000个用户咨询。其中大约60%的咨询需要查订单、查物流、查库存——这些都需要调用后端系统。如果每次调用都要经过大模型推理以目前主流大模型的定价来算光是工具调用的中间推理这一项每个月的Token费用可能就要几万甚至十几万。这笔钱花得冤不冤更关键的是很多工具调用的逻辑是确定的。比如查订单号12345的状态这个过程根本不需要大模型来思考——直接拿订单号去数据库里查就行了结果也是确定的。非要把一个确定性的操作绕一圈让大模型推理既费钱又费时。这就是问题所在MCP把所有操作都当成了需要AI推理的智能任务但实际上企业的大量操作是确定性的、规则明确的。三、企业真正需要的是什么执行环境Perplexity的退场表面上是Token税太高实际上暴露了一个更深层的问题——企业AI缺的不是接口标准而是执行环境。什么是执行环境简单说就是让AI能够直接执行确定性操作的能力层。我们来做一个类比。你用电脑的时候插了一个U盘USB-C接口电脑能识别它——这是MCP做的事情。但如果你想从U盘里拷贝一个文件到桌面你需要的是操作系统提供的文件管理能力——这就是执行环境。对于企业AI来说光让大模型知道有哪些工具可以调用是不够的还需要一个完整的执行环境来直接执行确定性操作不绕大模型管理工具调用的权限和审计处理多步骤任务的编排和串联保证操作的可追溯性这恰恰是目前大多数AI应用框架缺失的一环。大家都在拼命做接入更多模型、支持更多协议但很少有人认真思考企业真正需要的是什么样的执行环境。四、怎么解决这个问题解决Token税的思路其实很清晰把确定性的操作从大模型推理中剥离出来让它们直接执行。具体来说一个理想的AI执行环境应该具备以下特征第一确定性指令直通。对于那些规则明确、输入输出固定的操作比如查数据库、调API、读写文件应该封装成确定性指令直接执行不需要经过大模型推理。只有在需要理解和决策的环节才调用大模型。第二多级编排能力。一个复杂的业务场景往往包含多个步骤有些步骤需要AI推理有些步骤是确定性操作。好的执行环境应该能把这些步骤编排成一条链路自动判断哪些步骤走AI、哪些步骤直通。第三权限和安全管控。工具调用直接关联到业务数据必须有严格的权限控制和审计日志。不能因为有了AI就绕过企业的安全体系。第四可观测性。企业需要知道每个AI任务的执行过程哪些步骤花了多少Token、调用了哪些工具、结果是否正确。这对于成本优化和问题排查至关重要。五、从MCP争议看行业走向MCP协议本身是有价值的它推动了AI工具生态的标准化。但Perplexity的退场给行业提了个醒标准化接口只是第一步真正的难点在于如何构建高效的执行环境。最近有一个概念开始被越来越多的人讨论——AREEAI Runtime Execution EnvironmentAI运行时执行环境。这个概念的核心思想就是为企业AI应用提供一个完整的运行时环境在这个环境里确定性操作可以直接执行只有需要智能推理的部分才走大模型。这个思路其实和云计算的演进很像。早期大家觉得能虚拟化就行后来发现光虚拟化不够还需要容器编排Kubernetes、服务网格Service Mesh、可观测性OpenTelemetry等一系列基础设施。AI应用也正在经历类似的演进——从能接入大模型就行到需要完整的执行环境。对于正在做AI转型的企业来说我的建议是不要只盯着模型选型和接口协议多花点时间评估执行环境的能力。一个好的执行环境能帮你省掉大量的Token费用同时让AI应用的稳定性和可维护性大幅提升。MCP是USB-C接口但你的企业AI还需要一个操作系统。找到那个操作系统才是真正解决问题的关键。就比如JBoltAI平台在思维链编排、Function Call与MCP指令直达方面的设计正是围绕确定性操作不走大模型这个思路来构建的。有兴趣的同学可以了解一下看看实际工程中是怎么处理这个问题的。不管怎样Perplexity的这次退场对整个行业来说是一件好事。它让更多人开始思考企业AI到底需要什么答案正在变得越来越清晰。

OmenSuperHub：如何让你的惠普游戏本性能翻倍？这个免费开源工具做到了

OmenSuperHub：如何让你的惠普游戏本性能翻倍？这个免费开源工具做到了【免费下载链接】OmenSuperHub 使用 WMI BIOS控制性能和风扇速度，自动解除DB功耗限制。项目地址: https://gitcode.com/gh_mirrors/om/OmenSuperHub 你是否曾经在…...

2026/5/12 13:53:53 阅读更多 →

AI Agent记忆架构2026：短期、长期与语义记忆的工程实现全指南

深度技术解析 | 构建有记忆的AI Agent系统 —## 为什么Agent需要记忆？2026年，一个不会"记事"的AI Agent只能算半个Agent。想象一个客服Agent：用户第一次对话时说"我不喜欢太正式的回复风格"，下次打开对话却发…...

2026/5/12 13:53:52 阅读更多 →

如何在MongoDB中实现按时间跨度的分片路由_时间序列范围分片与冷热节点架构.txt

...

2026/5/12 13:49:42 阅读更多 →

【四川电影电视学院主办 | AP出版，高录用快见刊，最快刊后1个月内上知网谷歌学术 | 主题不设限，教育、艺术、语言等人文社科主题均可】第五届科学教育与艺术鉴赏国际学术会议（SEAA 2026）

高录用快见刊，会议快见刊，最快刊后1个月内上知网&谷歌学术主题不设限，教育、艺术、语言等人文社科主题均可第五届科学教育与艺术鉴赏国际学术会议（SEAA 2026） 2026 5th International Conference on Science …...

2026/5/11 9:28:07 阅读更多 →

【斯普林格Springer 旗下的Atlantis Press出版社出版 | EI Compendex、Scopus、谷歌学术】第五届区块链、信息技术与智慧经济国际学术会议（ICBIS 2026）

第五届区块链、信息技术与智慧经济国际学术会议（ICBIS 2026） The 5th International Conference on Blockchain, Information Technology and Smart Finance 2026年6月19日 -21日，中国-上海大会官网：www.ic-bis.net【论文投…...

2026/5/12 5:45:54 阅读更多 →