Discovery
Premise Challenge 6 问 + 强制方案对比 + 动线构建。把模糊需求问到能写测试。
Workflow Kit 是一个 Claude Code 插件—— 把一支真正运作的 AI 工程团队, 连同它的规划、协作、验收和工程纪律,装进你的命令行。
它是 Anthropic 官方出的命令行 AI Agent——能在你的项目里读文件、跑命令、改代码、调用 MCP / Skill。是目前 AI 编程里能跑「真任务」的那一档工具。
Claude Code 本身只是一个全能但没有同事的实习生——它会反应、会执行,但不会自我反问、不会写契约、不会替你验收、不会留下纪律。一个人挑战不了一个项目。
它变成一支真正运作的工程团队——会逼你把方向问清楚、会写跨文件契约、会派 Generator 和 Evaluator 两个 Agent 互相制衡、会替你验收、会替你记录。你只看最后那份 PASS 报告。
中间是主代理(你 + Claude Code)。它向下派单给 8 个阶段 Skill,向左右指挥 Generator–Evaluator 双 Agent。 两侧是 references(流程参考)和工程纪律护栏。所有这些不是文档——是 Claude Code 真的能识别、调度、执行的协议栈。
三笔账不会出现在你的发票里,但它们一直在收钱——从你的时间、心智, 和那个永远走不完的最后一公里。
同行每周都在 ship 新东西、新功能、新项目——你盯着同一个半成品, 第 N 次问 AI「这次应该差不多了吧」。 时间在流逝,别人在前进,你的想法还停在 git 里——这是所有损失里最贵的一笔,因为你看不见它。
本来用来想产品、想方向的脑子,全花在记「AI 刚改到哪了」、 「上次约定的接口是什么」、「它为什么又把这段删了」。 你是 AI 的人,不是 AI 替你干活。
AI 给你的一个个片段看起来都行——合起来不能稳定上线、没人替你验收、 没人替你兜住上线后的烂摊子。demo 很性感,能不能交付是另一回事。
它不会蒙头开工——它会反问你、跟你确认方向、一步步把你嘴里「想做的」走成浏览器里「能打开的」。
Team 模式不是「两个 AI 协作」那么简单——它是一个明确的有罪推定流程: Generator 必须先把 contract 写给 Evaluator 审,写完先 Evaluator 验,验不过不许合并。 失败的话 Evaluator 出报告,Generator 按报告改,循环到 PASS 才能动主分支。
Workflow Kit 把整个交付链路切成 8 个有名字、有契约、有验收标准的阶段。 下面每个阶段都是真实场景:左边是没装 Kit 的裸 Claude Code, 右边是装上 Kit 之后的 Claude Code——同一句开场白,结果差到不在一个维度上。
每个阶段下方有一个 可复制的开场咒语——直接 paste 进你的 Claude Code 就能让对应 Skill 接管。
"好的!我马上帮你生成一个 Next.js + Prisma 的博客模板。"
(直接当作前端偏好,绕过了「谁用、几个作者、要不要评论、多少文章、是否 SEO 优先」这些真正决定架构的问题。模糊在 PRD 里没有死,就会一路死在代码里。)
先按 Premise Challenge 把方向问到能写验收的程度:
① 最近一周谁因为没有这个具体被卡住过?
② 目标用户具体到人——什么时刻、看着什么、被什么打断?
③ 现在没有它的烂办法是什么?代价多大?
④ 最小可验收切片砍到不能再砍是什么样?
⑤ 明确不做什么、为什么排除?
⑥ 三个月后这事不可或缺还是被悄悄弃用?做对什么才会不可或缺?
.workflow/discovery/[name]-PRD.md"好的!我直接开写,前端假设返回数组。"
(第三天联调,后端返回的是对象;改 schema 又漏掉三个组件;「先跑起来」后面永远在补,「后面再说」永远没人说。)
先用 Goal-Backward 5 步反推,再写跨文件契约:
· 每个接口的 入参 / 出参 / 错误码 逐条写死
· 项目拆成 原子任务,每条带 verify 命令(< 60s 可执行)
· 关键决策清单:写出 must-have / nice-to-have / out-of-scope
· ExitPlanMode 前过 8 维度 Plan Self-Check——BLOCKER 不通过不放行
"好的,给你生成一个 Tailwind 默认模板。"
(你拿到一坨「AI 通用脸」——居中 H1 + 卡片网格 + 三段一组卖点。看起来像,但没有方向、跨页 token 各自为政、改一处崩三处。)
先按 8 阶段顾问流程走完方向探索:
① 读 PRD → ② 重述需求 → ③ 从 20 风格库推 3 个差异化方向
④ 展示 24 个预制 showcase 让你比对 → ⑤ 生成 3 视觉 Demo → ⑥ 你选定
⑦ 按 跨页打通五铁律铺所有页面(token 全局唯一 / 组件库共享 / mock 数据中心化 / 路由贯通 / Tweaks 跨页生效)
⑧ 5 维评分 → 写 bridge.md 移交 planning
"好的!已完成改动,请查看。"
(写到第 8 个文件忘了第 2 个文件约定的接口;测试自己写自己跑自己过;你 review 发现 3 个静默 bug,全部回炉。)
TeamCreate 派一支 AI 小队上:
· Generator 在 worktree 隔离分支里写代码 + 自测
· Evaluator 用 Playwright 真人点击验收,桌面 + 移动 375×667 双视口
· 两边通过 SendMessage 直接往返,主代理全程不动一行代码
· 不通过返工,循环到 PASS 才允许合并主分支
"部署命令执行成功,应该没问题。"
(两小时后用户反馈:iPhone 上「提交」按钮被 tab bar 挡住。你只在桌面端看了一眼,没人替你切移动视口,也没人真的点一下。)
先确认 CI 绿灯,再进 双轴验收:
· 从 git log / diff 推导本轮变更范围,对症验不瞎扫
· Playwright MCP 桌面 + 移动 375×667 双视口真实点击
· 找茬心态:默认每个改动都有 bug,由你证明它没有
· 前后端 AI 接口走双维度验收(不仅看 200,验语义)
· 失败自动回到 Diagnosis,不允许"算了下次再说"
"好,我加了个 try/catch 返回 401。"
(500 没再出现,但根因没修——只是被吞掉了。下个月同一个 bug 换种形式回来:用户丢状态、session 错乱、追三天找不到源头。)
先别急着改。按假设驱动协议走:
① 收集——抓日志 / 复现条件 / 请求样本
② 形成假设——列出 3 条可能原因并排优先级
③ 验证后才动手——3 次失败强制换路,禁止瞎试第 4 次
④ 修完必须说清为什么发生 + 如何避免,写进错误参考库
"好的,我帮你 scp 打包文件,再 ssh 跑 systemctl。"
(这个项目活了下来,下个项目还得重做一遍。.env 漏一个变量,现场排查;上线永远像渡河,每次都要赌一把。)
一次设定,永久 push 即发布:
· deploy-setup all 自动识别 8 种主流栈(Flask / Django / FastAPI / NestJS / Next.js / Nuxt / Vue / React SPA)
· sync-env 把本地 / CI / 线上三处变量一次对齐
· 之后每次 git push 自动走 CI/CD 上线
· 禁止绕过管道手动 scp / ssh / docker——一开口子,这套就垮了
"好的,README 我帮你复制了一份占位。"
(半年后新同事按 README 装到第三步死机;API 签名改了没人同步,调用方按旧参数传,线上 404 两天才发现。)
Verification 通过后自动加载,不需手动触发:
· 从 git log / git diff 推导本轮变更,漏不掉
· CLAUDE.md AI 维护区(HTML 锚点 <!-- AI-MAINTAINED:START..END -->)AI 只动锚点内,用户约束区一字不动
· CHANGELOG 三接触点:P1 commit 时增量 · P2 发版时切段 · P3 主动触发回看
· README 只留启动命令;架构动机 / SSOT 指针沉到 CLAUDE.md
· 只写"为什么",不写会随版本漂的"是什么"
AI slop(半成品、瞎自信、自己写自己测自己过)不是模型问题,是缺工程纪律。 Workflow Kit 把五条最关键的纪律内置成不可绕过的协议—— 装上之后,AI 想偷懒也偷不了。
Discovery 阶段强制 6 个 forcing questions——谁被卡住、用户是谁、烂办法是什么、最小验收切片、明确不做什么、3 个月后命运。把"用户应该想要"逼成"这周谁被卡住"。
ExitPlanMode 前过 Requirement Coverage / Task Completeness / Dependency / Key Links / Scope Sanity / must_haves / Scope Reduction / CLAUDE.md Compliance 八维。任一 BLOCKER 不通过不允许进入实现。
Generator 必须在 git worktree 隔离分支里干活,不污染主代码树。Sprint 完成 = PASS + 合并 + worktree + 分支原子四步,缺一不可。
Evaluator 不替 Generator 找证据证明它没坏——默认每个改动都有 bug,由 Generator 证明它没有。AI 接口走前后端双维度(语义 + 状态码)。3 次失败强制回 Diagnosis。
插件发版走 L1 工作树唯一性 / L2 发版完成 / L3 各副本 ff-only 同步 / L4 HEAD SHA 全等 四层闸门。防止"改了一份缓存,剩下三份还是旧的"这种远比看上去常见的事故。
「这次可以例外」「用户应该不介意」「这事问一下用户更稳妥」「我已经搞清楚了」——这些念头一冒头 AI 就停。把 AI 的合理化套路写进硬规则,避免它一边偷懒一边给自己讲故事。
8 阶段 + 2 meta + 3 前端专项 + 6 工具护栏,共 19 个—— 各自独立加载、独立职责、独立 Agent 执行。Skill 不是 prompt 模板,是 Claude Code 真的能识别和调度的协议。
Premise Challenge 6 问 + 强制方案对比 + 动线构建。把模糊需求问到能写测试。
Plan-Before-Code · Goal-Backward 5 步反推 · 8 维度 adversarial self-check.
8 阶段顾问 · 20 风格库 · 24 个预制 showcase · 跨页打通五铁律 · bridge.md 移交。
Team 模式 · Generator–Evaluator 双 Agent · Sprint Contract · Worktree 隔离。
git-diff 推变更 · Playwright MCP 双视口真人点击 · 找茬心态。
假设驱动 · 3 次失败强制换路 · 修完写错误参考库("为什么 + 如何避免")。
deploy-setup all 自动识别 8 种栈 · sync-env 三端对齐 · 禁手动 scp。
CLAUDE.md AI 维护区 HTML 锚点 · CHANGELOG 三接触点 · README 仅启动命令。
对话上下文存档 · /clear 后新 session 可读档续接 · 含类别级摘要 + 流水线长版双产出。
工作流复盘——失败之后改 skill / hook / description 本身,让下次同样的事不再发生。
单页快速实验 · 一次性组件 · 反 AI 通用脸(与 design 错位互补:design 主导多页工程化)。
50 风格 / 21 配色 / 50 字体配对 / 20 图表 · 9 技术栈(React / Vue / Svelte / SwiftUI / RN / Flutter)。
Vue 3 + TypeScript + vue-tsc + Volar 的正确 typing 模式 · 模板类型检查兜底。
外部 API 密钥安全读取。集中在 ~/.claude/glo.env,不入库、不粘贴、不出现在对话里。
创建新 skill / 改造现有 skill / 跑 eval 测 skill 性能。修改任何 skill 必须配合 plugin-publisher。
四层验证(canonical 唯一性 / push / 副本同步 / HEAD SHA)· 不走发版 = 只改了本地缓存。
批量检查 / 更新已安装 skill(含 Claude plugins 和 npx skills),智能合并本地改动。
Deploy 前数据库迁移护栏 · 风险评估 / 回滚检查 · 输出 PASS / WARN / BLOCK。
音频通知开关 · 长任务完成提示,不打断阅读。
Token 和 API 调用费三条路都要自己承担——这里比的是方法论本身的成本差。
招资深全栈 / 找外包按项目做。项目交付那天,人走了,方法论也一起走了——下一个项目重新找、重新对齐、重新踩坑。
Cursor + Replit + Devin + Sentry + Vercel + Octomind + Mintlify 凑齐—— 每家独立账单、每家锁在自己平台,停订一家整条链路掉一节。
一支 10+ 人团队、1.5 年迭代出的完整协议栈—— 19 个 Skill + 三角 Agent + 五道护栏,装进你自己的 Claude Code, 一套方法论打所有项目,不锁平台、不订阅。
没有订阅、没有席位、没有年费。所有未来 Skill 和更新永久免费同步给已购用户。
不是一组 prompt 模板——是主代理 + Team 三角 + 8 阶段 Skill + 五道工程纪律的完整协议栈。
不到一天资深开发的咨询费——换一支永不下班、不偷懒、不忘事的 AI 工程团队。
扫码进入对接通道——安装、接入、以及后续每一次协议栈演进, 由开发团队直接对接,名额不限。
七个最常被问到的问题,一次答完。
Prompt 包是给你照着抄的,Workflow Kit 是给 AI 自己调用的。
它内置一套主代理↔子代理的调度协议:Claude Code 会根据任务阶段自动调用对应 Skill,中间带状态机、契约校验、反合理化铁律。你只负责说结果,不负责分步骤。
Workflow Kit 是按 Claude Code 的 Skill 协议设计的,Claude Code 是一等公民。所有 Skill 的调用、Task 子代理派发、Hook 自动触发都依赖 Claude Code 的原生能力。
Cursor / Cline / Codex 没有 Skill / Task / Hook 协议——把这些文件当 system prompt 贴过去只能拿到表层描述,真正的调度机制用不上。
两者错位互补:
design——多页前端工程化设计阶段。8 阶段顾问流程 + 跨页打通五铁律 + bridge.md 移交 planning。适合做完整 web / app 产品视觉。
frontend-design——单页快速实验 / 一次性组件 / 创意原型。适合 landing 页、单个组件、artifact。
Workflow Kit 本身是一组本地文件(Skill 定义 + 提示词 + 脚本),不依赖任何我们这边的服务。只要你的 Claude Code 能连上 Anthropic 或任意镜像,Kit 就能跑。
可以。一个人付费,同一人名下所有项目都能用,包括商业项目、外包项目、企业内部项目。唯一的限制是不能把 Kit 本身打包二次售卖。
会。价格会随协议栈复杂度逐步上调——每次我们把 Skill / Hook / Agent 协议栈再往前推一大步,定价会往上走一档。所以越早拿到手越便宜,已购用户锁现价,每次升级都免费。
长期路线里我们不做订阅——Workflow Kit 是工具,不是服务。已购用户所有未来更新永久免费,无论以后定价走到哪一档都不会二次收费。
Skill 是语言无关的——它们控制流程,不控制代码本身。已经在用户项目里跑通过:TypeScript、Python、Go、Rust、Swift、Kotlin、Java、PHP。前端从 Next.js / Nuxt / SvelteKit 到 Vue / React 原生都覆盖。Deploy 阶段内置识别 Flask / Django / FastAPI / NestJS / Next.js / Nuxt / Vue SPA / React SPA 8 种主流栈。
你说出想要的,它反问你把想法拉直,然后替你做成能打开的东西。 一次买断 · 永久免费更新 · 不订阅 · 不席位。