5 月底 Google DeepMind 推出 Gemini 3.5 Flash 作为 Gemini App 与搜索 AI 模式的默认模型,在 Terminal-Bench 2.1 编码基准达到 76.2%、MCP Atlas 代理基准 83.6%,同时速度提升 4 倍、每 token 成本较此前旗舰版低约 40%。这一技术路径直接回应了企业对高性能低开支的需求。 这一动作发生在算力与能耗双重压力加剧的背景下。OpenAI 与 Anthropic 等对手仍以规模与对齐能力为主打,DeepMind 则通过架构优化实现“性价比跃升”。对比过去两年单纯堆叠参数的竞争,如今效率已成为新战场:谁能在相同预算下跑更多代理任务,谁就能在企业落地中占据先机。Nvidia 等硬件商的资本开支虽巨,但软件层面的优化正逐步稀释其定价权。 根本驱动力是企业从“演示驱动”转向“ROI 驱动”。代理应用场景下,推理成本若不下降,24/7 运行的商业模式难以规模化。DeepMind 此举既是防守(巩固 Google 生态),也是进攻(抢占代理经济份额)。 未来 6-12 个月,关键看其他前沿模型是否跟进类似轻量化架构。若 DeepMind 成本优势持续扩大,行业或加速从“参数军备”转向“效率护城河”;若对手快速追赶,效率红利将迅速均值化,资本注意力或重回安全与数据壁垒。 信源:https://businessanalytics.substack.com/p/300th-edition-deepminds-agentic-leap ✕ 📱 分享到微信 📤 分享图片 或长按图片 → Save to Photos → […]
大模型效率战升级 DeepMind 以成本优势突围
- Post author By TheBestDoll
- Post date
- Categories In 技术趋势
- No Comments on 大模型效率战升级 DeepMind 以成本优势突围
