AI 编程的四个阶段:从聊天到规范驱动,你处在哪一级?
概述
随着大模型技术的飞速发展,AI 不再只是”写代码的助手”,而正在重塑整个软件开发范式。从最初的问答聊天,到如今能理解架构意图、自动修复 bug、甚至基于测试规约生成可靠代码——AI 编程已悄然走过多个进化阶段。
本文提出一个实用的四阶段模型,帮助开发者理解自己所处的位置,并选择合适的工具提升效率。
阶段 1.0:Chat(对话式编程)
关键词:问答、片段生成、被动响应
干什么?
用户通过自然语言向 AI 提问,比如:
- “JAVA导出Excel,如何用 Python 连接 PostgreSQL?”
- “写一个快速排序函数”
AI 返回一段代码或解释,但不嵌入开发流程,需要人工复制粘贴、调试整合。
特点
- ✅ 遇到问题不再依赖搜索引擎、论坛
- ⚠️ 上下文有限(通常仅当前对话)
- ⚠️ 无项目感知
- ⚠️ 适合学习、查漏补缺,但难以用于生产级开发
主流工具
| 工具 | 特点 |
|---|---|
| ChatGPT | 通用问答最强,支持插件扩展 |
| DeepSeek-R1 | 中文场景优化,逻辑推理强 |
| 腾讯元宝 | 集成DeepSeek-R1、自家混元大模型,DeepSeek官网不好用的不二之选 |
| 阿里千问 | 阿里自家千问大模型,性能很炸,有实力,最近在面向C端出了桌面客户端 |
阶段 2.0:Copilot(辅助编程)
关键词:行级补全、IDE 集成、实时建议、Tab
干什么?
AI 深度集成到编辑器中,根据当前文件、项目结构、变量名等上下文,实时推荐下一行代码。用户按 Tab 接受建议。
典型场景:
- 输入
for user in users:→ 自动补全循环体 - 写函数注释后 → 自动生成函数体
- Tab自动建议、自动补全
特点
- ✅ 提升编码速度 20%~50%
- ⚠️ 仍由人主导逻辑,AI 只是”更快的手”
- ⚠️ 对复杂逻辑或跨文件依赖支持有限
主流工具
| 工具 | 特点 |
|---|---|
| GitHub Copilot | 市场占有率最高,支持多语言 |
| 通义灵码 | 免费、性能炸裂 |
| Cursor | 自定义大模型源,需要花钱升级Pro。3.0也有它,之所以放到这里是我同事在免费白嫖它的tab |
阶段 3.0:Vibe Coding(意图驱动编程)
关键词:氛围编程、角色切换、块级生成、人机共创
干什么?
开发者不再逐行写代码,而是通过自然语言描述意图(即”vibe”),让 AI 生成完整功能模块。有种敏捷开发模式叫结对编程,只不过VibeCoding是和AI结对,营造一种氛围感。
例如:
- 在文件顶部写注释:”实现一个 JWT 认证中间件,支持刷新令牌”
- 选中一段报错日志 → 点击 “Debug” → AI 自动修复并解释原因
更进一步,AI 能扮演不同角色:
- Architect:设计模块结构
- Coder:生成实现
- Reviewer:提供建议
- Debugger:定位并修复问题
特点
- ✅ 强调”心流体验”:减少上下文切换
- ✅ 支持跨文件、跨模块理解
- ✅ 允许模糊指令,AI 自行推断最佳实践
主流工具
| 工具 | 特点 |
|---|---|
| Claude Code | 可以切换国内大模型,国内自由使用。当之无愧的王者,命令行可以轻松拥有系统级别操作权限(很多程序员在初次简单它会很不习惯,很不屑,比如我,但看到太多的文章案例,上手后就被打脸了) |
| Kilo Code | 可以切换国内大模型,国内自由使用。当前最成熟的多角色 Vibe Coding 平台,支持 Architect/Code/Ask/Debug/Orchestrator 模式,集成 MCP 工具链 |
| 国内产品 | Qoder、Trae、CodeBuddy(还没用过) |
⚠️ 重要:Vibe Coding的结果,需要人类来审核。当然你可以说,我仍然借助AI,用sub Agent角色扮演,但你要为最终结果负责。
阶段 4.0:Spec Coding(规范驱动编程)
关键词:规约先行、可验证、自动化交付
干什么?
开发者提供形式化或半形式化的规格说明(spec),AI 自动生成正确、可维护、可测试的代码。
例如:
- 提供 OpenAPI 文档 → 自动生成服务端骨架 + 客户端 SDK
- 编写一组单元测试 → AI 实现满足所有测试的函数(TDD 风格)
- 使用状态机 DSL 描述业务流程 → 生成状态管理代码
核心理念:“不是猜你想做什么,而是证明我做对了”
特点
- ✅ 输出具备工程级可靠性
- ✅ 可与 CI/CD 流水线集成
- ✅ 适用于核心业务、金融、嵌入式等高要求场景
主流工具(仍在早期)
- Claude Code:看好它,毕竟有那么大的忠实用户,它也在进化
- Kilo Code + Spec-kit / Orchestrator:通过 MCP 协议接入 spec 解析器,将高层任务拆解为带验收条件的子任务
- 传统工具增强:如 Swagger Codegen + AI 后处理(过渡方案)
番外篇
关于阶段划分的补充说明
矛盾观点:把Copilot放到2.0阶段可能有点不合适,实际上GitHub Copilot要比ChatGPT要早面世,那时候GitHub还不属于微软。但ChatGPT之后Copilot能力确实也在进化,从操作难度上把它放到2.0阶段也是合适的,毕竟在ChatGPT之后大模型才爆发,才有了后来。
额外补充:严格意义上讲,Spec Coding 这里其实应该指AI Spec Coding,毕竟Spec Coding 的思想根源确实可以追溯到几十年前的软件工程实践——尤其是测试驱动开发(TDD)、契约式设计(前后端分离的API Frist)。当在AI 开发领域将它也属于Vibe Coding 范畴也是可以的,因为有Vibe Coding以后,人们发现之前Spec Coding 没有盛行的原因解决了,比如AI可以很好的帮你写测试用例,写文档,定义API。Spec Coding是更为规范的实践阶段,是一个AI编程的又进化过程。而这种模式容易被大规模的团队协作开发接受。
关于工具生态
- Kilo Code:站在 3.0 顶峰,迈向 4.0 的桥梁,在众多 AI 编程工具中,Kilo Code 是目前最接近”全栈智能开发者”的产品。它不仅支持多角色切换(它的架构模式很赞),还通过 Orchestrator 模式 + MCP 工具生态,初步实现了基于规约的任务分解与验证。
- 工具层面:其他家也都会敢上来的,早晚的问题。
- 残酷现实:不崇洋媚外,这些先进的理念确实都是国外在引领,国内一直在追赶。
- 自由畅想:中午和同事聊天,千模大战之后,AI可能会变成你用不起的样子,手搓代码会变成廉价替代还是奢侈品?
结语:你的下一站是哪里?
| 你现在的状态 | 建议尝试 |
|---|---|
| 还在复制 ChatGPT 代码? | → 升级到 Copilot 或 Cursor,进入 2.0 |
| 已习惯 Tab 补全? | → 试试 Kilo Code 的 Architect 模式,体验 3.0 心流 |
| 带团队做核心系统? | → 探索 Spec-kit + 自动测试驱动开发,布局 4.0 |
AI 编程的终极目标,不是让机器写代码,而是让人更专注于”为什么写”和”写得对不对”。
而你,已经站在这场变革的入口。
延伸阅读
KiloCode-架构模式
- 公众号:debao.wang
- AI学习实践:KiloCode-架构模式篇
Vibe vs Spec Coding 通俗解读
- 作者:宝哥
- 公众号:debao.wang
原文首发于 debao.wang
