听完了AMD的AI开发者大会，我算清了两笔账！

张

张建站

2026/5/21 18:54:11

10分钟阅读

作者猫叔上周我和一个做企业级AI Agent智能体的创业者喝咖啡。他最近愁得直挠头因为好几个大客户的单子都卡在了采购流程上。他的公司做了一套能自动处理繁杂工单、生成深度分析报告的AI系统。客户业务部门看演示时双眼放光但一到结账环节死活推不动。企业的财务部门拿着放大镜看采购单扔回两个灵魂拷问。第一按Token计费的云端API是个无底洞明年的预算怎么做第二看不见摸不着的纯软件系统要花大几十万怎么按“固定资产”入账另外公司的IT部门还在一旁反复强调“核心业务数据绝不能上云”的红线。“B端客户既要AI的脑子又不接受昂贵的云端的账单。”他端起咖啡猛灌了一口说“这简直无解。”跟他分别后的第二天也就是5月19号我来到了 AMD AI开发者大会AMD AI DevDay 2026上海站现场挤满了两千多人。本来我是想去看看在这个大模型狂飙的节点芯片巨头又要在云端算力上怎么“卷”参数。但几场看下来我突然反应过来AI的风向已经悄悄变了。01 别光盯着GPU硬磕了AI是个“系统工程”大会一开场AMD董事会主席及首席执行官苏姿丰博士Dr. Lisa Su和零一万物创始人兼CEO李开复博士坐在台上对谈。让我意外的是他们聊的重头戏不是算力怎么进一步突破而是“AI智能体新范式”。AMD董事会主席及首席执行官苏姿丰博士Dr. Lisa Su和零一万物创始人兼CEO李开复博士过去这两年整个科技圈都被潜移默化地洗脑大家都认同一个观点搞AI嘛就是拼命堆积GPU。但是如今的企业Agent业务流里AI早就不是过去那种“画个图、写首诗”的简单交互了。现在的智能体需要多步推理、逻辑调度、长文本串行处理。在这个漫长的“思考”过程里单纯的矩阵乘法GPU的强项其实只占了一小部分剩下高达80%的环节比如复杂的内存管理、庞大的KV Cache键值缓存完全是CPU的舒适区。也就是说在真实的企业落地场景里单靠GPU“单腿蹦”已经行不通了。顺着这个逻辑我又去听了AMD高级副总裁、计算与图形总经理Jack Huynh的演讲他在台上抛出了一个“智能体主机Agentic AI Engine”概念这会儿我的思路就彻底通透了。AMD这次其实是在用系统级的“CPUGPU”双引擎来重构底层骨架。比如你要在本地搭建一个极其复杂的AI微调和开发底座就可以用AMD锐龙Threadripper PRO 9000系列处理器的工作站。我查了一下它的性能最多支持128条PCIe 5.0通道。这意味着在多并发任务下它能极其宽裕地给多块GPU和高速NVMe存储喂数据绝不让系统I/O成为短板。而如果遇到极其吃内存的本地AI推理任务用AMD Radeon AI PRO R9700 就能顶上借助RDNA 4架构和32GB的大显存原本在普通机器上会直接爆显存的复杂模型在这里跑得稳稳当当。02 100 tokens/秒的“端侧黑盒子”专治IT内耗不过机房里的高端工作站解决的是研发问题真正要发到每个员工手里、部署进企业业务线的得是更轻量、更集成的设备。这也是整场大会最让我兴奋的环节阶跃星辰联合创始人兼CTO朱亦博博士在台上分享了一组实测数据主角是搭载了 AMD 锐龙 AI Max系列处理器的智能体主机。其实我也见过不少贴着AI标签的高端工作站但这款智能体主机却把参数推到了一个离谱的地步——至高支持96GB GPU专属显存。在这台设备上高达200B参数的大模型比如Qwen 3.5 122B不仅能实现原生本地运行而且解码速度逼近100 tokens/秒。我在脑子里迅速换算了一下100 tokens/秒大概意味着一篇长达千字的业务分析报告在你端起杯子喝口水的功夫就能在本地离线生成。这不就是开篇那个创业朋友的“解药”吗不再需要去解释什么是API调用费不再需要跟IT主管争论数据上云的风险。只需要把复杂的Agent应用全部封装进这台搭载着锐龙 AI Max 的黑盒子里连同硬件一起卖给客户。对于传统企业来说这不再是一项难以获批的“软件服务”而是一台实打实的“智能算力设备”直接走固定资产采购流程插上电、连上内网就能干活。用硬件的形态蹚过国内软件商业化的深水区。03 连点成线生态要做全套当然再强悍的硬件如果没有顺手的软件生态把底层逻辑串起来充其量也就是个昂贵的“电暖器”。所以我也专门去留意了AMD在软件栈上的动作。AMD的底牌是全面升级的 AMD ROCm软件栈。现在的ROCm早就脱离了只在Linux数据中心里转悠的局限它真正打通了从本地笔记本、工作站到云端的全路径。比如最新的ROCm 7.2版本就已经能够跨平台支持Windows不仅可以通过新版PyTorch实现高效部署还能对最新的 AMD锐龙 AI 400系列处理器提供深度支持。开发者甚至可以直接在ComfyUI里下载调用对HIPCC编译器和OpenClaw等智能体框架的兼容也做得相当丝滑。“一次编写全路径运行。”站在展区看着一行行代码顺畅跑通时我意识到这句话的分量。正如AMD高级副总裁、大中华区总裁潘晓明提到的今年是AMD上海研发中心成立二十周年。二十年的本土研发深耕加上这次宣布的基于Radeon GPU的免费开发者云AMD是在用真金白银给中国的AI生态做基建。AMD高级副总裁、大中华区总裁潘晓明现场展区04 写在最后随着散场的人流走出场馆外面的天色已经暗了下来但我心里的那笔账却越算越明白。过去我们总以为AI的终局一定在云端一切终端不过是连向云服务器的屏幕。但真实的商业世界是不按剧本出牌的。数据主权的红线、高昂的按次计费、国内独有的IT采购习惯正在强力扭转这个趋势。企业需要的并非一个改变世界的AI概念而是一件握在自己手里、成本可控、能立刻落地的干活工具。把部分云端能力回落到边缘侧把“软能力”封装进“硬盒子”这条路已经成为当下B端AI商业化的新路径。而今天AMD这套从锐龙 AI Max 到 ROCm 的全栈端侧底座无疑已经把铺路最硬的那几块砖稳稳地递到了开发者手里。