小米MiMo V2.5系列公测:能力强但联网检索待提升,未来赋能生态可期
【小米MiMo V2.5系列开启公测】4月23日小米MiMo V2.5系列模型开启公测。据官方介绍该系列模型推理能力更强、Agent更稳定还有多模态感知能力能看懂文本也能理解图片、音频等信息。在Artificial Analysis榜单中Xiaomi MiMo - V2.5 - Pro综合智能指数位列全球开源大模型第一。【MiMo V2.5实测能力与不足并存】目前MiMo V2.5系列已开放公测小米用户可在MiMo官网体验相关模型产品。虽网页端使用场景不能完全发挥大模型潜力但可作摸底。通过五个案例测试MiMo V2.5实力。案例一文章总结。将雷科技关于ChatGPT Images 2.0评测的图文链接给MiMo V2.5 Pro它2秒生成结果准确概括文章优缺点评价。案例二盘点小米2025年发布的手机型号。MiMo - V2.5 Pro表现一般罗列的小米15系列是2024年机型还遗漏了小米17系列等且误以为小米15S Pro未发布。其他大模型表现也不完美Gemini 3.1 Pro虚构出小米16系列DeepSeek表现相对较好但也遗漏了小米15S Pro。案例三去洗车店洗车该走路还是开车去。MiMo V2.5 Pro未被绕进去指出洗车前提是车要过去。案例四帮看医院检验报告。MiMo V2.5支持多模态输入医院检查图片它能识别检查项目并给出结论和建议。普通照片如模糊的、logo被遮挡的Switch图片它也能准确识别。案例五做浏览器能运行的小游戏。MiMo - V2.5 Pro能快速生成解一元二次方程的HTML程序加大难度写围棋程序也能顺利完成。【MiMo Claw测试表现有亮点有不足】伴随MiMo - V2.5系列发布小米上线了MiMo Claw目前处于测试阶段通过网页端运行单次体验限时1小时超时数据销毁可重新创建项目体验。通过三个场景测试其表现。场景一新闻抓取。要求搜索当天科技要闻并按怀旧风格生成海报它模仿90年代杂志风格不错排版问题不大但信息联网检索能力一般时效性不足。场景二财报分析。将28页苹果财报PDF文件给MiMo Claw它精准概括重点并给出结论iPhone是功臣研发投入暴增31.7%服务业务稳健增长但增速放缓Mac和可穿戴拖后腿现金流充沛。其工作流是提取文本信息保存为TXT文件再翻译、分析、归纳总结但基于网页端运行与主流网页端大模型差距不大。场景三文档优化。小米官方称MiMo Claw与金山生态合作在Office文档处理有优势。用陈旧排版的大学课件测试要求着重美化排版参考科技公司Keynote生成的PPT排版效果变好字体颜色更正常。【终端品牌入局大模型小米有长远规划】MiMo - V2.5系列大模型及MiMo Claw公测阶段有问题但模型和Agent能力出色。大规模公测能为小米提供改进方向。MiMo - V2.5系列面向普通用户和开发者公测同时上线Token付费服务。小米迭代大模型不只为秀技术和赚服务费而是深度赋能消费核心业务。如小爱同学融入全模态能力将跨越式进化从被动指令执行工具转型为超级管家能看懂屏幕内容、听懂自然语言。小米AI技术可应用于手机也能融入「人车家」生态。未来产品蓝图不局限于智能家居和汽车还包括人形机器人、AI硬件等。如今大模型成为打通智能场景生态的核心大脑这是智能终端赛道的共识。小米深化人车家全生态荣耀等厂商也推进底层AI重构荣耀人形机器人夺冠就是证明手机厂商正从终端硬件品牌向AI生态品牌转型。未来小米大模型能否持续优化在生态中发挥更大作用