AI, Agent

2026-04-05

...

整站

2026年AI Agent新范式：Superpowers、GStack、Critic与YOLO模式深度解析

2026 年 AI Agent 圈最火的四个概念：Superpowers、GStack、Critic 模式与 YOLO 模式

如果你最近刷到这些词却一头雾水，这篇文章帮你一次搞清楚。

前言：为什么这些概念突然火了？

2025 年底到 2026 年初，AI 编程助手完成了一次质的跳跃——从”帮你写代码”进化成”替你干活”。Cursor、Claude Code、Codex 这些工具相继支持真正的 Agent 模式：AI 不再只是补全代码，而是能自主分析需求、制定计划、拆解任务、执行命令、自我纠错，像一个独立运转的开发者。

这一波进化带来了新的问题：怎么驯服这头野兽？ 一个能自主运行的 Agent，如果没有工程纪律约束，它会写出低质量代码、跑飞需求、甚至删掉你的文件。

于是，社区里出现了一批”驯化方法论”——Superpowers、GStack 是工程化的约束框架，Critic 模式是自我纠错机制，YOLO 模式是放开限制的全自动选项。它们代表着 Agent 应用的两个极端方向：一个更结构化，一个更自由。

一、Superpowers：给 Agent 装上”职业素养”

它是什么？

Superpowers 是 Jesse Vincent（Prime Radiant 团队）开发的开源框架，GitHub 已突破 8 万 star。核心理念是：

不是让 AI 直接写代码，而是先让它像高级工程师一样思考——理解需求、制定计划、拆分任务，再逐步执行。

本质上，它是一套可组合的”技能”（Skills）集合，每个技能对应软件开发工作流中的一个环节，被注入到 Claude Code 或 Codex 的上下文中，强制 AI 在特定步骤按规范行事。

核心技能列表

技能名称	功能
`brainstorming`	苏格拉底式需求澄清，输出分块设计文档
`writing-plans`	将任务拆成 2–5 分钟的细粒度步骤
`executing-plans`	分批执行，设置人工检查点
`test-driven-development`	强制红-绿-重构循环，禁止没有测试的代码
`systematic-debugging`	4 阶段根因分析（假设→验证→追踪→修复）
`subagent-driven-development`	每个任务派发给独立子 Agent，两阶段评审
`requesting-code-review`	提交前自查清单，按严重程度报告问题
`using-git-worktrees`	每个功能建立独立分支和工作区

核心机制：Subagent-Driven-Development

这是整个框架最精髓的部分。当主 Agent 确认好实现计划后，每个小任务会分配给一个全新的子 Agent 来执行，然后经历强制的两阶段评审：

第一阶段：规范合规性评审

代码是否严格遵循了之前确认的设计计划？
文件路径、技术栈、测试用例是否与约定一致？
功能行为是否与预期匹配？

第二阶段：代码质量评审

是否有潜在的逻辑错误、边界情况处理不当？
是否有重复代码、可读性问题？
是否有安全漏洞或性能隐患？

这种机制的价值在于责任分离：子 Agent 专注”实现”，主 Agent 专注”协调与监督”，大幅降低低级错误溜进代码库的概率。

它解决了什么问题？

传统 AI 编程助手的痛点是”会飞”——给一个复杂需求，AI 可能直接开始写代码，写到一半发现方向不对，又绕回来，最终产出一堆混乱的东西。Superpowers 强制 AI 在动手之前先把需求想清楚、计划写明白，把人类工程师几十年积累的软件工程方法论——TDD、DRY、YAGNI、代码审查——固化成 AI 的行为约束。

二、GStack：Y Combinator CEO 亲手打造的虚拟开发团队

它是什么？

GStack（G 来自创始人 Garry Tan 的名字首字母）是 Y Combinator 现任 CEO Garry Tan 开发并开源的 Claude Code 技能包，官网地址 gstacks.org，当前版本 v0.4.1，MIT 协议。

它的核心理念比 Superpowers 更直接：

把单个 AI 助手变成一支虚拟软件开发团队，不同阶段调用不同”认知模式”，让 AI 扮演专家角色而非通用助手。

九大角色技能

GStack 提供 9 个通过斜杠命令调用的专家角色：

命令	角色	核心问题
`/plan-ceo-review`	创始人 / CEO	“这是用户真正需要的吗？”
`/plan-eng-review`	工程经理	“技术架构、数据流和边缘情况是否想清楚了？”
`/review`	偏执的高级工程师	“哪里会在生产环境炸掉？”
`/ship`	发布工程师	自动同步分支、运行测试、创建 PR
`/browse`	QA 工程师	启动无头浏览器，点击、截图、检查控制台
`/qa`	QA 主管 + 修复工程师	系统化测试 + 自动修复 + 健康评分
`/qa-only`	QA 报告员	只出 Bug 报告，不修改代码
`/setup-browser-cookies`	会话管理器	从本地浏览器导入 Cookie，测试登录态页面
`/retro`	工程经理	分析提交历史，出复盘报告

它和 Superpowers 有什么区别？

两者有相似的设计思想（通过技能/角色让 AI 更专业），但侧重不同：

	Superpowers	GStack
核心诉求	工程纪律：TDD、代码审查、子 Agent	角色分工：不同阶段切换不同专家视角
适用阶段	贯穿整个开发流程	从产品规划到发布的完整生命周期
独特能力	子 Agent 并行执行	内置浏览器视觉 QA（真正有”眼睛”）
创始人背景	工程师社区	YC CEO，偏产品视角

GStack 最亮眼的功能是 /browse 和 /qa——它们让 AI 不只是看代码，而是真的能”打开浏览器”、登录应用、点击页面、截图验证，弥补了纯代码审查看不到前端视觉效果的盲区。

三、Critic 模式：给 Agent 装上”自检系统”

它是什么？

Critic 模式（又称 Reflection / 反思模式）是 AI Agent 设计中的一种经典架构模式，核心思想是：

AI 不应该一次性输出结果就结束，而应该对自己的输出进行批判性评估，发现问题后修正，再评估，形成闭环。

这来源于人类工程师的日常工作方式——写完代码后 review 一遍，发现问题再改，而不是写完就提交。

工作机制

Critic 模式通常由两个角色构成一个循环：

用户任务
    ↓
【生产者 Agent】生成初始结果（代码/文档/计划）
    ↓
【评审者 Agent（Critic）】批判性评估
    ├── 发现问题 → 生成修改建议 → 返回生产者重做
    └── 通过评审 → 输出最终结果

生产者 Agent 的设计原则：

专注”完成”，高效产出
使用较低 temperature（如 0.1），保持稳定输出
按评审反馈修改，不争辩

评审者 Agent（Critic）的设计原则：

专注”挑错”，预设怀疑态度
提供明确的评审清单（功能完整性、性能、安全、可读性）
发现无问题时输出固定终止信号（如 CODE_IS_PERFECT），防止无限循环

为什么需要终止机制？

一个没有终止条件的 Critic 循环会变成无限循环——评审者总能找到可以改进的地方。实践中通常设置：

最大迭代次数（如 3 轮）
质量阈值（评审分数达到 90 分即停止）
终止关键词（生产者检测到 CODE_IS_PERFECT 即输出结果）

适用场景

场景	收益
代码生成	发现逻辑错误、安全漏洞、未覆盖的边界情况
长文档写作	校对事实、逻辑连贯性、表达优化
复杂推理	验证推导链条，避免幻觉式结论
计划制定	找到遗漏的风险和依赖关系

与 Superpowers / GStack 的关系

Superpowers 里的 subagent-driven-development 两阶段评审、GStack 里的 /review 角色，本质上都是 Critic 模式的工程化落地。区别在于 Critic 模式是通用设计理念，而后两者是在具体 Claude Code / Agent 工作流中的实现。

四、YOLO 模式：把 Agent 的缰绳彻底松开

它是什么？

YOLO 模式（YOLO = You Only Live Once，即”活在当下”）是 Cursor IDE 中 Agent 模式的一项增强功能，正式名称为 Auto-Run。

它的逻辑非常简单：

普通 Agent 模式每次要执行终端命令都要等你点”确认”。YOLO 模式把这个确认步骤去掉——Agent 自己决定要跑什么命令，自己执行，你只管最终结果。

开启 YOLO 后，当你给 Agent 一个任务，它会一气呵成地完成：

1	接收任务 → 安装依赖 → 创建文件 → 启动服务 → 检测错误 → 自动修复 → 运行测试

全程无需人工介入，效率提升 5–10 倍（对简单任务尤其明显）。

如何开启

Cmd+Shift+J 打开 Cursor 设置
Features > Agent > Enable YOLO Mode
（新版可能显示为 Auto-Run）

关键配置

YOLO 模式不是”完全放开”，而是通过精确配置控制 AI 的权限边界：

允许列表（Command Allowlist）：明确可以自动执行的命令

1 2	npm test, npm run build, git add, git commit, eslint, prettier, python -m pytest, ...

拒绝列表（Command Denylist）：永远不允许自动执行

1 2	rm -rf, sudo, git push --force, DROP TABLE, kubectl delete, ...

YOLO Prompt：用自然语言描述允许边界

1
2
3

允许所有测试、构建和开发服务器命令。
允许 git add 和 git commit，但禁止 git push。
禁止删除任何文件。

安全风险

YOLO 模式被安全公司 Backslash Security 专门出报告警告过。核心风险：

危险命令执行：拒绝列表不够全面时，AI 可能执行 rm -rf 导致文件丢失
级联失败：一个命令的错误结果被后续命令放大，最终造成严重问题
敏感信息泄露：AI 可能在终端输出中意外打印 API 密钥等环境变量
提示注入攻击：恶意内容被读入上下文，诱导 AI 执行有害命令

最佳实践：

生产环境或有敏感数据的项目不要开 YOLO
允许列表从空开始，按需添加，而非从全开始限制
始终开启文件删除保护（Delete File Protection）
高频 git commit，出事了可以快速回退

谁适合用 YOLO 模式？

场景	建议
个人项目原型开发	✅ 非常适合，大幅提速
团队协作项目	⚠️ 禁止 push，只允许本地操作
有测试套件的项目	✅ 配合自动测试效果极佳
生产环境	❌ 不建议开启
含敏感数据的库	❌ 不建议开启

五、这四个概念的关系图谱

这四个概念并不是独立的——它们共同构成了”Agent 工程化”这个议题的不同切面：

AI Agent 能力提升
        │
        ├─ 【如何约束】── Superpowers（工程化流程约束）
        │                └── 子 Agent + TDD + 代码审查
        │
        ├─ 【如何协同】── GStack（角色分工）
        │                └── CEO / 工程师 / QA 等角色切换
        │
        ├─ 【如何自纠】── Critic 模式（自我反思）
        │                └── 生成 → 评审 → 修正 闭环
        │
        └─ 【如何提速】── YOLO 模式（去掉人工确认）
                         └── Auto-Run + 权限边界配置

它们的使用逻辑是：

想要 AI 产出高质量代码 → Superpowers 或 GStack 给它加上工程纪律
想要 AI 自我发现并修复错误 → 在提示词或框架中嵌入 Critic 模式
想要 AI 自动跑完整个流程不打断 → 在安全边界内开启 YOLO 模式

实际工程中，这几个概念往往同时使用：开 YOLO 让 AI 自动跑命令，用 Critic 机制让它自我检查代码，用 Superpowers/GStack 的技能约束它的开发流程。

六、趋势判断

这几个概念集中爆发，背后是 AI 编程工具正在经历一次范式迁移：

从”辅助写代码” → “自主完成任务”

当 Agent 能自主运行时，随之而来的工程问题——质量保障、风险控制、流程标准化——催生了这些方法论。这和人类工程师发展史惊人相似：当代码规模增大，人们发明了 Code Review、TDD、CI/CD。现在，这些实践正在被固化成 Agent 的行为约束。

可以预见，未来 12 个月内：

技能/提示词框架（Superpowers、GStack 类）会越来越标准化，甚至成为 AI IDE 的内置功能
Critic 模式会被集成进更多框架，成为 Agent 的默认行为而非可选项
YOLO 类自动运行会在安全机制成熟后逐步普及，但同时对 AI 安全的要求也会更高

结语

这四个概念的本质，是在回答同一个问题：当 AI 可以自主行动，我们如何保证它走在正确的轨道上？

Superpowers 和 GStack 说：给它装上工程师的职业素养。
Critic 模式说：让它学会自我反思。
YOLO 模式说：在安全边界内，放开它。

没有哪个答案是唯一正确的——这取决于你的任务、风险偏好和信任程度。但理解这些概念，能让你在使用 AI 编程助手时更清楚自己在做什么选择，而不是稀里糊涂地”vibe coding”。

参考资料：GitHub obra/superpowers · gstacks.org · cursor-ide.com · 掘金技术社区 · 51CTO