2026年AI Agent新范式:Superpowers、GStack、Critic与YOLO模式深度解析

2026 年 AI Agent 圈最火的四个概念:Superpowers、GStack、Critic 模式与 YOLO 模式

如果你最近刷到这些词却一头雾水,这篇文章帮你一次搞清楚。


前言:为什么这些概念突然火了?

2025 年底到 2026 年初,AI 编程助手完成了一次质的跳跃——从”帮你写代码”进化成”替你干活”。Cursor、Claude Code、Codex 这些工具相继支持真正的 Agent 模式:AI 不再只是补全代码,而是能自主分析需求、制定计划、拆解任务、执行命令、自我纠错,像一个独立运转的开发者。

这一波进化带来了新的问题:怎么驯服这头野兽? 一个能自主运行的 Agent,如果没有工程纪律约束,它会写出低质量代码、跑飞需求、甚至删掉你的文件。

于是,社区里出现了一批”驯化方法论”——SuperpowersGStack 是工程化的约束框架,Critic 模式是自我纠错机制,YOLO 模式是放开限制的全自动选项。它们代表着 Agent 应用的两个极端方向:一个更结构化,一个更自由。


一、Superpowers:给 Agent 装上”职业素养”

它是什么?

Superpowers 是 Jesse Vincent(Prime Radiant 团队)开发的开源框架,GitHub 已突破 8 万 star。核心理念是:

不是让 AI 直接写代码,而是先让它像高级工程师一样思考——理解需求、制定计划、拆分任务,再逐步执行。

本质上,它是一套可组合的”技能”(Skills)集合,每个技能对应软件开发工作流中的一个环节,被注入到 Claude Code 或 Codex 的上下文中,强制 AI 在特定步骤按规范行事。

核心技能列表

技能名称 功能
brainstorming 苏格拉底式需求澄清,输出分块设计文档
writing-plans 将任务拆成 2–5 分钟的细粒度步骤
executing-plans 分批执行,设置人工检查点
test-driven-development 强制红-绿-重构循环,禁止没有测试的代码
systematic-debugging 4 阶段根因分析(假设→验证→追踪→修复)
subagent-driven-development 每个任务派发给独立子 Agent,两阶段评审
requesting-code-review 提交前自查清单,按严重程度报告问题
using-git-worktrees 每个功能建立独立分支和工作区

核心机制:Subagent-Driven-Development

这是整个框架最精髓的部分。当主 Agent 确认好实现计划后,每个小任务会分配给一个全新的子 Agent 来执行,然后经历强制的两阶段评审

第一阶段:规范合规性评审

  • 代码是否严格遵循了之前确认的设计计划?
  • 文件路径、技术栈、测试用例是否与约定一致?
  • 功能行为是否与预期匹配?

第二阶段:代码质量评审

  • 是否有潜在的逻辑错误、边界情况处理不当?
  • 是否有重复代码、可读性问题?
  • 是否有安全漏洞或性能隐患?

这种机制的价值在于责任分离:子 Agent 专注”实现”,主 Agent 专注”协调与监督”,大幅降低低级错误溜进代码库的概率。

它解决了什么问题?

传统 AI 编程助手的痛点是”会飞”——给一个复杂需求,AI 可能直接开始写代码,写到一半发现方向不对,又绕回来,最终产出一堆混乱的东西。Superpowers 强制 AI 在动手之前先把需求想清楚、计划写明白,把人类工程师几十年积累的软件工程方法论——TDD、DRY、YAGNI、代码审查——固化成 AI 的行为约束。


二、GStack:Y Combinator CEO 亲手打造的虚拟开发团队

它是什么?

GStack(G 来自创始人 Garry Tan 的名字首字母)是 Y Combinator 现任 CEO Garry Tan 开发并开源的 Claude Code 技能包,官网地址 gstacks.org,当前版本 v0.4.1,MIT 协议。

它的核心理念比 Superpowers 更直接:

把单个 AI 助手变成一支虚拟软件开发团队,不同阶段调用不同”认知模式”,让 AI 扮演专家角色而非通用助手。

九大角色技能

GStack 提供 9 个通过斜杠命令调用的专家角色:

命令 角色 核心问题
/plan-ceo-review 创始人 / CEO “这是用户真正需要的吗?”
/plan-eng-review 工程经理 “技术架构、数据流和边缘情况是否想清楚了?”
/review 偏执的高级工程师 “哪里会在生产环境炸掉?”
/ship 发布工程师 自动同步分支、运行测试、创建 PR
/browse QA 工程师 启动无头浏览器,点击、截图、检查控制台
/qa QA 主管 + 修复工程师 系统化测试 + 自动修复 + 健康评分
/qa-only QA 报告员 只出 Bug 报告,不修改代码
/setup-browser-cookies 会话管理器 从本地浏览器导入 Cookie,测试登录态页面
/retro 工程经理 分析提交历史,出复盘报告

它和 Superpowers 有什么区别?

两者有相似的设计思想(通过技能/角色让 AI 更专业),但侧重不同:

Superpowers GStack
核心诉求 工程纪律:TDD、代码审查、子 Agent 角色分工:不同阶段切换不同专家视角
适用阶段 贯穿整个开发流程 从产品规划到发布的完整生命周期
独特能力 子 Agent 并行执行 内置浏览器视觉 QA(真正有”眼睛”)
创始人背景 工程师社区 YC CEO,偏产品视角

GStack 最亮眼的功能是 /browse/qa——它们让 AI 不只是看代码,而是真的能”打开浏览器”、登录应用、点击页面、截图验证,弥补了纯代码审查看不到前端视觉效果的盲区。


三、Critic 模式:给 Agent 装上”自检系统”

它是什么?

Critic 模式(又称 Reflection / 反思模式)是 AI Agent 设计中的一种经典架构模式,核心思想是:

AI 不应该一次性输出结果就结束,而应该对自己的输出进行批判性评估,发现问题后修正,再评估,形成闭环。

这来源于人类工程师的日常工作方式——写完代码后 review 一遍,发现问题再改,而不是写完就提交。

工作机制

Critic 模式通常由两个角色构成一个循环:

1
2
3
4
5
6
7
用户任务

【生产者 Agent】生成初始结果(代码/文档/计划)

【评审者 Agent(Critic)】批判性评估
├── 发现问题 → 生成修改建议 → 返回生产者重做
└── 通过评审 → 输出最终结果

生产者 Agent 的设计原则:

  • 专注”完成”,高效产出
  • 使用较低 temperature(如 0.1),保持稳定输出
  • 按评审反馈修改,不争辩

评审者 Agent(Critic)的设计原则:

  • 专注”挑错”,预设怀疑态度
  • 提供明确的评审清单(功能完整性、性能、安全、可读性)
  • 发现无问题时输出固定终止信号(如 CODE_IS_PERFECT),防止无限循环

为什么需要终止机制?

一个没有终止条件的 Critic 循环会变成无限循环——评审者总能找到可以改进的地方。实践中通常设置:

  • 最大迭代次数(如 3 轮)
  • 质量阈值(评审分数达到 90 分即停止)
  • 终止关键词(生产者检测到 CODE_IS_PERFECT 即输出结果)

适用场景

场景 收益
代码生成 发现逻辑错误、安全漏洞、未覆盖的边界情况
长文档写作 校对事实、逻辑连贯性、表达优化
复杂推理 验证推导链条,避免幻觉式结论
计划制定 找到遗漏的风险和依赖关系

与 Superpowers / GStack 的关系

Superpowers 里的 subagent-driven-development 两阶段评审、GStack 里的 /review 角色,本质上都是 Critic 模式的工程化落地。区别在于 Critic 模式是通用设计理念,而后两者是在具体 Claude Code / Agent 工作流中的实现。


四、YOLO 模式:把 Agent 的缰绳彻底松开

它是什么?

YOLO 模式(YOLO = You Only Live Once,即”活在当下”)是 Cursor IDE 中 Agent 模式的一项增强功能,正式名称为 Auto-Run

它的逻辑非常简单:

普通 Agent 模式每次要执行终端命令都要等你点”确认”。YOLO 模式把这个确认步骤去掉——Agent 自己决定要跑什么命令,自己执行,你只管最终结果。

开启 YOLO 后,当你给 Agent 一个任务,它会一气呵成地完成:

1
接收任务 → 安装依赖 → 创建文件 → 启动服务 → 检测错误 → 自动修复 → 运行测试

全程无需人工介入,效率提升 5–10 倍(对简单任务尤其明显)。

如何开启

  1. Cmd+Shift+J 打开 Cursor 设置
  2. Features > Agent > Enable YOLO Mode
  3. (新版可能显示为 Auto-Run

关键配置

YOLO 模式不是”完全放开”,而是通过精确配置控制 AI 的权限边界:

允许列表(Command Allowlist):明确可以自动执行的命令

1
2
npm test, npm run build, git add, git commit,
eslint, prettier, python -m pytest, ...

拒绝列表(Command Denylist):永远不允许自动执行

1
2
rm -rf, sudo, git push --force,
DROP TABLE, kubectl delete, ...

YOLO Prompt:用自然语言描述允许边界

1
2
3
允许所有测试、构建和开发服务器命令。
允许 git add 和 git commit,但禁止 git push。
禁止删除任何文件。

安全风险

YOLO 模式被安全公司 Backslash Security 专门出报告警告过。核心风险:

  1. 危险命令执行:拒绝列表不够全面时,AI 可能执行 rm -rf 导致文件丢失
  2. 级联失败:一个命令的错误结果被后续命令放大,最终造成严重问题
  3. 敏感信息泄露:AI 可能在终端输出中意外打印 API 密钥等环境变量
  4. 提示注入攻击:恶意内容被读入上下文,诱导 AI 执行有害命令

最佳实践:

  • 生产环境或有敏感数据的项目不要开 YOLO
  • 允许列表从空开始,按需添加,而非从全开始限制
  • 始终开启文件删除保护(Delete File Protection)
  • 高频 git commit,出事了可以快速回退

谁适合用 YOLO 模式?

场景 建议
个人项目原型开发 ✅ 非常适合,大幅提速
团队协作项目 ⚠️ 禁止 push,只允许本地操作
有测试套件的项目 ✅ 配合自动测试效果极佳
生产环境 ❌ 不建议开启
含敏感数据的库 ❌ 不建议开启

五、这四个概念的关系图谱

这四个概念并不是独立的——它们共同构成了”Agent 工程化”这个议题的不同切面:

1
2
3
4
5
6
7
8
9
10
11
12
13
AI Agent 能力提升

├─ 【如何约束】── Superpowers(工程化流程约束)
│ └── 子 Agent + TDD + 代码审查

├─ 【如何协同】── GStack(角色分工)
│ └── CEO / 工程师 / QA 等角色切换

├─ 【如何自纠】── Critic 模式(自我反思)
│ └── 生成 → 评审 → 修正 闭环

└─ 【如何提速】── YOLO 模式(去掉人工确认)
└── Auto-Run + 权限边界配置

它们的使用逻辑是

  • 想要 AI 产出高质量代码 → SuperpowersGStack 给它加上工程纪律
  • 想要 AI 自我发现并修复错误 → 在提示词或框架中嵌入 Critic 模式
  • 想要 AI 自动跑完整个流程不打断 → 在安全边界内开启 YOLO 模式

实际工程中,这几个概念往往同时使用:开 YOLO 让 AI 自动跑命令,用 Critic 机制让它自我检查代码,用 Superpowers/GStack 的技能约束它的开发流程。


六、趋势判断

这几个概念集中爆发,背后是 AI 编程工具正在经历一次范式迁移:

从”辅助写代码” → “自主完成任务”

当 Agent 能自主运行时,随之而来的工程问题——质量保障、风险控制、流程标准化——催生了这些方法论。这和人类工程师发展史惊人相似:当代码规模增大,人们发明了 Code Review、TDD、CI/CD。现在,这些实践正在被固化成 Agent 的行为约束。

可以预见,未来 12 个月内:

  • 技能/提示词框架(Superpowers、GStack 类)会越来越标准化,甚至成为 AI IDE 的内置功能
  • Critic 模式会被集成进更多框架,成为 Agent 的默认行为而非可选项
  • YOLO 类自动运行会在安全机制成熟后逐步普及,但同时对 AI 安全的要求也会更高

结语

这四个概念的本质,是在回答同一个问题:当 AI 可以自主行动,我们如何保证它走在正确的轨道上?

Superpowers 和 GStack 说:给它装上工程师的职业素养。
Critic 模式说:让它学会自我反思。
YOLO 模式说:在安全边界内,放开它。

没有哪个答案是唯一正确的——这取决于你的任务、风险偏好和信任程度。但理解这些概念,能让你在使用 AI 编程助手时更清楚自己在做什么选择,而不是稀里糊涂地”vibe coding”。


参考资料:GitHub obra/superpowers · gstacks.org · cursor-ide.com · 掘金技术社区 · 51CTO