蚂蚁 Vibe Coding 平台实践：让非技术员工“说”出全栈应用

2026-05-22

蚂蚁 Vibe Coding 平台实践：让非技术员工“说”出全栈应用

导语

在蚂蚁集团内部，一个名为 Vibe Coding 的平台已经落地运行了半年。它的核心定位非常明确：让非技术员工通过自然语言对话，直接生成前后端一体化的应用。从 PMO 的战役管理平台，到 HR 的内部流程系统，再到 C 端营销活动页面，非研发人员正在通过“像聊天一样开发”的方式，成为 AI 加持下的超级个体。

然而，从“玩具”到“生产级工具”的跨越，并非靠大模型的能力自然溢出，而是需要硬核的工程体系来承接。本文将复盘蚂蚁 Vibe Coding 平台落地过程中的核心技术挑战与解法，以及从真实业务中沉淀出的 AI 时代软件设计哲学。

核心问题与挑战

当非技术用户开始用自然语言构建复杂应用时，传统软件开发中的工程问题会以更尖锐的方式暴露出来。我们在实践中主要面临以下两大类挑战：

工程效能瓶颈

Token 消耗极快：重度用户单月 Token 消耗可达 5000 元，成本压力巨大。
超长对话遗忘：单项目对话轮次超过 2000 轮后，Agent 出现严重的健忘与逻辑混乱。
巨型项目卡顿：随着项目文件数量膨胀，Agent 响应变慢，且代码修改极易出现偏差。
数据库门槛高：业务人员无法用精确的技术语言描述数据库表结构，导致持久化层设计受阻。

业务场景壁垒

私有知识盲区：AI 听不懂企业内部黑话和私有知识。
数据安全与互通：HR 系统需频繁调取员工数据，但存在敏感数据保障难题；同时内部生态割裂，信息不通。
C 端交付极难：营销场景对高保真还原、客户端适配及高并发要求极高，远超普通对话生成的能力边界。

方案与实践

针对上述挑战，我们在底层工程架构与业务场景适配上进行了深度改造。

攻克工程效能瓶颈

1. 精准化 Search/Replace 与高命中率 Cache（应对 Token 消耗）
放弃全量重写文件的传统模式，改为精准化的 Search/Replace，配合高命中率的 Cache 机制，整体削减了约 80% 的 Token 消耗，大幅降低单次修改的成本。

2. 意图与索引分离的 Memory 体系（应对长对话遗忘）
构建了意图、索引与技能分离的 Memory 体系。不再将所有上下文塞入 Prompt，而是实现记忆的自动卸载与按需召回，确保 Agent 在超长轮次对话中保持核心意图的稳定性。

3. File Graph 与主动加载/卸载（应对巨型项目卡顿）
为巨型项目构建文件图谱（File Graph），Agent 不再一次性读取所有代码，而是根据当前任务主动加载所需的外部信息，处理完毕后主动卸载，显著提高了分析效率与修改准确性。

4. 意图驱动 DDL 与快照回滚（应对数据库门槛高）
业务人员只需表达业务意图（如“我要做个投票”），Agent 根据意图全自动完成 SQL/CRUD 设计。同时引入快照回滚机制，确保一旦表结构生成偏离预期，可快速回退，降低试错成本。

业务场景落地与架构跃迁

HR 场景：从黑话到技能，从隔离到打通

针对内部黑话，支持业务人员自助将内部知识 Skills 化，让 AI 懂业务。
针对数据不通，预置组件与技能；针对敏感数据，实施数据环境隔离与独立权限角色管控，保障合规。

营销场景：多模态与高可用基建

高保真还原：引入 D2C 多模态能力直接还原设计稿。
客户端适配：预置移动端脚手架与 llms.txt 规范。
高并发应对：依托高性能基础设施，并构建自动测试与修复闭环，实现“写得快，发得快”。

架构跃迁：去 Workflow 与 Skills 化
真实业务（特别是 PMO 那个超 2000 轮对话的生产级项目）倒逼了底层架构升级。我们彻底摒弃了固化的 Workflow，走向了去 Workflow、Skills 化和 AI 友好的自主决策架构。Agent 不再按部就班，而是根据意图自主调度技能。

原则/方法论沉淀

从半年的工程实践中，我们提炼出以下面向 AI 时代的架构与设计原则：

一切皆文件与 Git：AI 时代的软件设计哲学是“一切内容皆文件、一切文件用 Git 管理、一切会话在 WorkTree 发生”。这为 Agent 提供了最清晰、最可控的操作界面。
架构设计首要面向变化：在 AI 时代，任何事情都有可能在 3 个月后发生巨变。架构的第一优先级不再是极致的性能或复用，而是面向变化的敏捷响应。
Model + Harness = Agent：仅靠大模型（Model）无法保证确定性，必须构建 Harness（约束与验证闭环）。通过“验证-反馈-修复”的闭环持续达成目标交付，这是驾驭 Agent 行为的核心方法论。
基建必须天生 AI 友好：基础设施的受众正在从 Developer 转向 Agent。文档的第一读者变为机器，接口必须 IaC 化并提供 llms.txt，保障 AI 会写、能调。
技能的一等公民化：只有 AI 原生掌握的技能才是未来的一等公民，传统的 API 封装需要向 Agent 友好的 Skills 演进。

总结与行动建议

AI 时代的用户不在意代码过程，只在意结果交付。Token 就是未来的电，降低 Token 消耗、提升单位 Token 的产出效能是工程团队的核心命题。

对于正在或即将构建 AI Coding 平台的团队，我们建议：

放弃对全量代码生成的执念，转向 Search/Replace 与精准缓存，这是控制成本的关键。
优先建设 File Graph 与 Memory 体系，这是 Agent 从玩具走向生产级项目的基础设施。
将基础设施的 AI 友好度作为架构评审的硬指标，没有 llms.txt 和 IaC 化的内部系统，将率先成为 Agent 自动化的绊脚石。
交付结果而非代码过程，围绕 Model + Harness 构建你的 Agent 工程体系，用闭环验证代替单向生成。

开放问题与延伸方向

Token 削减的基准测试：宣称削减约 80% Tokens 的基准环境与任务复杂度如何？Search/Replace 与 Cache 在不同代码规模和语言下的命中率差异仍需标准化评估。（关联：Token 成本控制方案的适用边界）
“快照回滚”的认知负担：让非技术背景人员面对快照回滚这种开发者概念，是否违背了“像聊天一样开发”的初衷？（关联：产品交互与工程底层的平衡）
意图驱动 DDL 的脏数据风险：若 Agent 对业务边界理解微小偏差，全自动 SQL/CRUD 是否会导致不可逆的脏数据甚至级联删除？（关联：自动化与安全兜底机制）
“一切皆文件”与高并发一致性：在应对高并发营销场景的状态强一致性要求时，Git 机制是否存在天然架构短板？（关联：设计哲学在极端场景的局限性）
Skills 化的意外收益：将企业黑话 Skills 化，是否意外打通了企业内部长期割裂的知识孤岛？（关联：平台溢出价值）
Model + Harness 的泛化能力：该验证闭环框架是否为解决大模型“幻觉”提供了一种可工程落地的通用解法，不仅限于代码生成？（关联：Agent 工程方法论的推广）
File Graph 的替代路径：除了主动加载/卸载，能否借鉴数据库视图机制，让 Agent 仅在逻辑视图操作而无需感知物理文件？（关联：巨型项目上下文管理的创新解法）
面向机器的 API 规范：基建文档第一读者变为机器，是否会催生一种“机器先读、人机共审”的新型 API 设计规范或中间语言？（关联：天生 AI 友好的具体落地形态）
去 Workflow 与 Harness 的边界：在宣称去 Workflow 的同时又强调 Harness 约束，何时该约束何时该放权？（关联：Agent 自主性与可控性的元反思）
下一步的工程假设：平台从解决单点技术挑战走向重塑软件设计哲学，下一步最应优先验证的工程假设是什么？（关联：平台未来演进的破局点）

jsonContent: meta: false pages: false posts: title: true date: true path: true text: false raw: false content: false slug: false updated: false comments: false link: false permalink: false excerpt: false categories: false tags: true