概述

随着大模型技术的飞速发展,AI 不再只是”写代码的助手”,而正在重塑整个软件开发范式。从最初的问答聊天,到如今能理解架构意图、自动修复 bug、甚至基于测试规约生成可靠代码——AI 编程已悄然走过多个进化阶段。

本文提出一个实用的四阶段模型,帮助开发者理解自己所处的位置,并选择合适的工具提升效率。


阶段 1.0:Chat(对话式编程)

关键词:问答、片段生成、被动响应

干什么?

用户通过自然语言向 AI 提问,比如:

  • “JAVA导出Excel,如何用 Python 连接 PostgreSQL?”
  • “写一个快速排序函数”

AI 返回一段代码或解释,但不嵌入开发流程,需要人工复制粘贴、调试整合。

特点

  • ✅ 遇到问题不再依赖搜索引擎、论坛
  • ⚠️ 上下文有限(通常仅当前对话)
  • ⚠️ 无项目感知
  • ⚠️ 适合学习、查漏补缺,但难以用于生产级开发

主流工具

工具 特点
ChatGPT 通用问答最强,支持插件扩展
DeepSeek-R1 中文场景优化,逻辑推理强
腾讯元宝 集成DeepSeek-R1、自家混元大模型,DeepSeek官网不好用的不二之选
阿里千问 阿里自家千问大模型,性能很炸,有实力,最近在面向C端出了桌面客户端

阶段 2.0:Copilot(辅助编程)

关键词:行级补全、IDE 集成、实时建议、Tab

干什么?

AI 深度集成到编辑器中,根据当前文件、项目结构、变量名等上下文,实时推荐下一行代码。用户按 Tab 接受建议。

典型场景

  • 输入 for user in users: → 自动补全循环体
  • 写函数注释后 → 自动生成函数体
  • Tab自动建议、自动补全

特点

  • ✅ 提升编码速度 20%~50%
  • ⚠️ 仍由人主导逻辑,AI 只是”更快的手”
  • ⚠️ 对复杂逻辑或跨文件依赖支持有限

主流工具

工具 特点
GitHub Copilot 市场占有率最高,支持多语言
通义灵码 免费、性能炸裂
Cursor 自定义大模型源,需要花钱升级Pro。3.0也有它,之所以放到这里是我同事在免费白嫖它的tab

阶段 3.0:Vibe Coding(意图驱动编程)

关键词:氛围编程、角色切换、块级生成、人机共创

干什么?

开发者不再逐行写代码,而是通过自然语言描述意图(即”vibe”),让 AI 生成完整功能模块。有种敏捷开发模式叫结对编程,只不过VibeCoding是和AI结对,营造一种氛围感。

例如:

  • 在文件顶部写注释:”实现一个 JWT 认证中间件,支持刷新令牌”
  • 选中一段报错日志 → 点击 “Debug” → AI 自动修复并解释原因

更进一步,AI 能扮演不同角色

  • Architect:设计模块结构
  • Coder:生成实现
  • Reviewer:提供建议
  • Debugger:定位并修复问题

特点

  • ✅ 强调”心流体验”:减少上下文切换
  • ✅ 支持跨文件、跨模块理解
  • ✅ 允许模糊指令,AI 自行推断最佳实践

主流工具

工具 特点
Claude Code 可以切换国内大模型,国内自由使用。当之无愧的王者,命令行可以轻松拥有系统级别操作权限(很多程序员在初次简单它会很不习惯,很不屑,比如我,但看到太多的文章案例,上手后就被打脸了)
Kilo Code 可以切换国内大模型,国内自由使用。当前最成熟的多角色 Vibe Coding 平台,支持 Architect/Code/Ask/Debug/Orchestrator 模式,集成 MCP 工具链
国内产品 Qoder、Trae、CodeBuddy(还没用过)

⚠️ 重要:Vibe Coding的结果,需要人类来审核。当然你可以说,我仍然借助AI,用sub Agent角色扮演,但你要为最终结果负责。


阶段 4.0:Spec Coding(规范驱动编程)

关键词:规约先行、可验证、自动化交付

干什么?

开发者提供形式化或半形式化的规格说明(spec),AI 自动生成正确、可维护、可测试的代码。

例如:

  • 提供 OpenAPI 文档 → 自动生成服务端骨架 + 客户端 SDK
  • 编写一组单元测试 → AI 实现满足所有测试的函数(TDD 风格)
  • 使用状态机 DSL 描述业务流程 → 生成状态管理代码

核心理念“不是猜你想做什么,而是证明我做对了”

特点

  • ✅ 输出具备工程级可靠性
  • ✅ 可与 CI/CD 流水线集成
  • ✅ 适用于核心业务、金融、嵌入式等高要求场景

主流工具(仍在早期)

  • Claude Code:看好它,毕竟有那么大的忠实用户,它也在进化
  • Kilo Code + Spec-kit / Orchestrator:通过 MCP 协议接入 spec 解析器,将高层任务拆解为带验收条件的子任务
  • 传统工具增强:如 Swagger Codegen + AI 后处理(过渡方案)

番外篇

关于阶段划分的补充说明

矛盾观点:把Copilot放到2.0阶段可能有点不合适,实际上GitHub Copilot要比ChatGPT要早面世,那时候GitHub还不属于微软。但ChatGPT之后Copilot能力确实也在进化,从操作难度上把它放到2.0阶段也是合适的,毕竟在ChatGPT之后大模型才爆发,才有了后来。

额外补充:严格意义上讲,Spec Coding 这里其实应该指AI Spec Coding,毕竟Spec Coding 的思想根源确实可以追溯到几十年前的软件工程实践——尤其是测试驱动开发(TDD)、契约式设计(前后端分离的API Frist)。当在AI 开发领域将它也属于Vibe Coding 范畴也是可以的,因为有Vibe Coding以后,人们发现之前Spec Coding 没有盛行的原因解决了,比如AI可以很好的帮你写测试用例,写文档,定义API。Spec Coding是更为规范的实践阶段,是一个AI编程的又进化过程。而这种模式容易被大规模的团队协作开发接受。

关于工具生态

  • Kilo Code:站在 3.0 顶峰,迈向 4.0 的桥梁,在众多 AI 编程工具中,Kilo Code 是目前最接近”全栈智能开发者”的产品。它不仅支持多角色切换(它的架构模式很赞),还通过 Orchestrator 模式 + MCP 工具生态,初步实现了基于规约的任务分解与验证。
  • 工具层面:其他家也都会敢上来的,早晚的问题。
  • 残酷现实:不崇洋媚外,这些先进的理念确实都是国外在引领,国内一直在追赶。
  • 自由畅想:中午和同事聊天,千模大战之后,AI可能会变成你用不起的样子,手搓代码会变成廉价替代还是奢侈品?

结语:你的下一站是哪里?

你现在的状态 建议尝试
还在复制 ChatGPT 代码? → 升级到 Copilot 或 Cursor,进入 2.0
已习惯 Tab 补全? → 试试 Kilo Code 的 Architect 模式,体验 3.0 心流
带团队做核心系统? → 探索 Spec-kit + 自动测试驱动开发,布局 4.0

AI 编程的终极目标,不是让机器写代码,而是让人更专注于”为什么写”和”写得对不对”

而你,已经站在这场变革的入口。


延伸阅读

  • KiloCode-架构模式

    • 公众号:debao.wang
    • AI学习实践:KiloCode-架构模式篇
  • Vibe vs Spec Coding 通俗解读

    • 作者:宝哥
    • 公众号:debao.wang

原文首发于 debao.wang

文章封面