蚂蚁 Vibe Coding 平台实践:让非技术员工“说”出全栈应用
导语
在蚂蚁集团内部,一个名为 Vibe Coding 的平台已经落地运行了半年。它的核心定位非常明确:让非技术员工通过自然语言对话,直接生成前后端一体化的应用。从 PMO 的战役管理平台,到 HR 的内部流程系统,再到 C 端营销活动页面,非研发人员正在通过“像聊天一样开发”的方式,成为 AI 加持下的超级个体。
然而,从“玩具”到“生产级工具”的跨越,并非靠大模型的能力自然溢出,而是需要硬核的工程体系来承接。本文将复盘蚂蚁 Vibe Coding 平台落地过程中的核心技术挑战与解法,以及从真实业务中沉淀出的 AI 时代软件设计哲学。
核心问题与挑战
当非技术用户开始用自然语言构建复杂应用时,传统软件开发中的工程问题会以更尖锐的方式暴露出来。我们在实践中主要面临以下两大类挑战:
工程效能瓶颈
- Token 消耗极快:重度用户单月 Token 消耗可达 5000 元,成本压力巨大。
- 超长对话遗忘:单项目对话轮次超过 2000 轮后,Agent 出现严重的健忘与逻辑混乱。
- 巨型项目卡顿:随着项目文件数量膨胀,Agent 响应变慢,且代码修改极易出现偏差。
- 数据库门槛高:业务人员无法用精确的技术语言描述数据库表结构,导致持久化层设计受阻。
业务场景壁垒
- 私有知识盲区:AI 听不懂企业内部黑话和私有知识。
- 数据安全与互通:HR 系统需频繁调取员工数据,但存在敏感数据保障难题;同时内部生态割裂,信息不通。
- C 端交付极难:营销场景对高保真还原、客户端适配及高并发要求极高,远超普通对话生成的能力边界。
方案与实践
针对上述挑战,我们在底层工程架构与业务场景适配上进行了深度改造。
攻克工程效能瓶颈
1. 精准化 Search/Replace 与高命中率 Cache(应对 Token 消耗)
放弃全量重写文件的传统模式,改为精准化的 Search/Replace,配合高命中率的 Cache 机制,整体削减了约 80% 的 Token 消耗,大幅降低单次修改的成本。
2. 意图与索引分离的 Memory 体系(应对长对话遗忘)
构建了意图、索引与技能分离的 Memory 体系。不再将所有上下文塞入 Prompt,而是实现记忆的自动卸载与按需召回,确保 Agent 在超长轮次对话中保持核心意图的稳定性。
3. File Graph 与主动加载/卸载(应对巨型项目卡顿)
为巨型项目构建文件图谱(File Graph),Agent 不再一次性读取所有代码,而是根据当前任务主动加载所需的外部信息,处理完毕后主动卸载,显著提高了分析效率与修改准确性。
4. 意图驱动 DDL 与快照回滚(应对数据库门槛高)
业务人员只需表达业务意图(如“我要做个投票”),Agent 根据意图全自动完成 SQL/CRUD 设计。同时引入快照回滚机制,确保一旦表结构生成偏离预期,可快速回退,降低试错成本。
业务场景落地与架构跃迁
HR 场景:从黑话到技能,从隔离到打通
- 针对内部黑话,支持业务人员自助将内部知识 Skills 化,让 AI 懂业务。
- 针对数据不通,预置组件与技能;针对敏感数据,实施数据环境隔离与独立权限角色管控,保障合规。
营销场景:多模态与高可用基建
- 高保真还原:引入 D2C 多模态能力直接还原设计稿。
- 客户端适配:预置移动端脚手架与 llms.txt 规范。
- 高并发应对:依托高性能基础设施,并构建自动测试与修复闭环,实现“写得快,发得快”。
架构跃迁:去 Workflow 与 Skills 化
真实业务(特别是 PMO 那个超 2000 轮对话的生产级项目)倒逼了底层架构升级。我们彻底摒弃了固化的 Workflow,走向了去 Workflow、Skills 化和 AI 友好的自主决策架构。Agent 不再按部就班,而是根据意图自主调度技能。
原则/方法论沉淀
从半年的工程实践中,我们提炼出以下面向 AI 时代的架构与设计原则:
- 一切皆文件与 Git:AI 时代的软件设计哲学是“一切内容皆文件、一切文件用 Git 管理、一切会话在 WorkTree 发生”。这为 Agent 提供了最清晰、最可控的操作界面。
- 架构设计首要面向变化:在 AI 时代,任何事情都有可能在 3 个月后发生巨变。架构的第一优先级不再是极致的性能或复用,而是面向变化的敏捷响应。
- Model + Harness = Agent:仅靠大模型(Model)无法保证确定性,必须构建 Harness(约束与验证闭环)。通过“验证-反馈-修复”的闭环持续达成目标交付,这是驾驭 Agent 行为的核心方法论。
- 基建必须天生 AI 友好:基础设施的受众正在从 Developer 转向 Agent。文档的第一读者变为机器,接口必须 IaC 化并提供 llms.txt,保障 AI 会写、能调。
- 技能的一等公民化:只有 AI 原生掌握的技能才是未来的一等公民,传统的 API 封装需要向 Agent 友好的 Skills 演进。
总结与行动建议
AI 时代的用户不在意代码过程,只在意结果交付。Token 就是未来的电,降低 Token 消耗、提升单位 Token 的产出效能是工程团队的核心命题。
对于正在或即将构建 AI Coding 平台的团队,我们建议:
- 放弃对全量代码生成的执念,转向 Search/Replace 与精准缓存,这是控制成本的关键。
- 优先建设 File Graph 与 Memory 体系,这是 Agent 从玩具走向生产级项目的基础设施。
- 将基础设施的 AI 友好度作为架构评审的硬指标,没有 llms.txt 和 IaC 化的内部系统,将率先成为 Agent 自动化的绊脚石。
- 交付结果而非代码过程,围绕 Model + Harness 构建你的 Agent 工程体系,用闭环验证代替单向生成。
开放问题与延伸方向
- Token 削减的基准测试:宣称削减约 80% Tokens 的基准环境与任务复杂度如何?Search/Replace 与 Cache 在不同代码规模和语言下的命中率差异仍需标准化评估。(关联:Token 成本控制方案的适用边界)
- “快照回滚”的认知负担:让非技术背景人员面对快照回滚这种开发者概念,是否违背了“像聊天一样开发”的初衷?(关联:产品交互与工程底层的平衡)
- 意图驱动 DDL 的脏数据风险:若 Agent 对业务边界理解微小偏差,全自动 SQL/CRUD 是否会导致不可逆的脏数据甚至级联删除?(关联:自动化与安全兜底机制)
- “一切皆文件”与高并发一致性:在应对高并发营销场景的状态强一致性要求时,Git 机制是否存在天然架构短板?(关联:设计哲学在极端场景的局限性)
- Skills 化的意外收益:将企业黑话 Skills 化,是否意外打通了企业内部长期割裂的知识孤岛?(关联:平台溢出价值)
- Model + Harness 的泛化能力:该验证闭环框架是否为解决大模型“幻觉”提供了一种可工程落地的通用解法,不仅限于代码生成?(关联:Agent 工程方法论的推广)
- File Graph 的替代路径:除了主动加载/卸载,能否借鉴数据库视图机制,让 Agent 仅在逻辑视图操作而无需感知物理文件?(关联:巨型项目上下文管理的创新解法)
- 面向机器的 API 规范:基建文档第一读者变为机器,是否会催生一种“机器先读、人机共审”的新型 API 设计规范或中间语言?(关联:天生 AI 友好的具体落地形态)
- 去 Workflow 与 Harness 的边界:在宣称去 Workflow 的同时又强调 Harness 约束,何时该约束何时该放权?(关联:Agent 自主性与可控性的元反思)
- 下一步的工程假设:平台从解决单点技术挑战走向重塑软件设计哲学,下一步最应优先验证的工程假设是什么?(关联:平台未来演进的破局点)