3 weken geleden · c5b55c1bf9
--- a/README.md
+++ b/README.md
@@ -10,7 +10,7 @@ Anthropic 官方 [Claude Code](https://docs.anthropic.com/en/docs/claude-code) C
 
															 - [x] V2 会完整实现工程化配套设施;
														
 
															   - [ ] Biome 格式化可能不会先实施, 避免代码冲突
														
 
															   - [x] 构建流水线完成, 产物 Node/Bun 都可以运行
														
 
															-- [ ] V3 会实现多层级解耦, 很多比如 UI 包, Agent 包都可以独立优化;
														
 
															+- [ ] V3 会写大量文档, 完善文档站点
														
 
															 - [ ] V4 会完成大量的测试文件, 以提高稳定性
														
 
															 > 我不知道这个项目还会存在多久, fork 不好使, git clone 或者下载 .zip 包才稳健;
														
@@ -54,6 +54,10 @@ bun run build
 
															 构建采用 code splitting 多文件打包（`build.ts`），产物输出到 `dist/` 目录（入口 `dist/cli.js` + 约 450 个 chunk 文件）。构建出的版本 bun 和 node 都可以启动, 你 publish 到私有源可以直接启动
														
 
															+## 相关文档及网站
														
 
															+
														
 
															+<https://deepwiki.com/claude-code-best/claude-code>
														
 
															+
														
 
															 ## Star History
														
 
															 <a href="https://www.star-history.com/?repos=claude-code-best%2Fclaude-code&type=date&legend=top-left">
														
--- a/RECORD.md
+++ b/RECORD.md
@@ -1,218 +0,0 @@
 
															-# Claude Code 项目运行记录
														
 
															-
														
 
															-> 项目: `/Users/konghayao/code/ai/claude-code`
														
 
															-> 日期: 2026-03-31
														
 
															-> 包管理器: bun
														
 
															-
														
 
															----
														
 
															-
														
 
															-## 一、项目目标
														
 
															-
														
 
															-**将 claude-code 项目运行起来，必要时可以删减次级能力。**
														
 
															-
														
 
															-这是 Anthropic 官方 Claude Code CLI 工具的源码反编译/逆向还原项目。
														
 
															-
														
 
															-### 核心保留能力
														
 
															-
														
 
															-- API 通信（Anthropic SDK / Bedrock / Vertex）
														
 
															-- Bash/FileRead/FileWrite/FileEdit 等核心工具
														
 
															-- REPL 交互界面（ink 终端渲染）
														
 
															-- 对话历史与会话管理
														
 
															-- 权限系统（基础）
														
 
															-- Agent/子代理系统
														
 
															-
														
 
															-### 已删减的次级能力
														
 
															-
														
 
															-| 模块 | 处理方式 |
														
 
															-|------|----------|
														
 
															-| Computer Use (`@ant/computer-use-*`) | stub |
														
 
															-| Claude for Chrome (`@ant/claude-for-chrome-mcp`) | stub |
														
 
															-| Magic Docs / Voice Mode / LSP Server | 移除 |
														
 
															-| Analytics / GrowthBook / Sentry | 空实现 |
														
 
															-| Plugins/Marketplace / Desktop Upsell | 移除 |
														
 
															-| Ultraplan / Tungsten / Auto Dream | 移除 |
														
 
															-| MCP OAuth/IDP | 简化 |
														
 
															-| DAEMON / BRIDGE / BG_SESSIONS / TEMPLATES 等 | feature flag 关闭 |
														
 
															-
														
 
															----
														
 
															-
														
 
															-## 二、当前状态：Dev 模式已可运行
														
 
															-
														
 
															-```bash
														
 
															-# dev 运行
														
 
															-bun run dev
														
 
															-# 直接运行
														
 
															-bun run src/entrypoints/cli.tsx
														
 
															-# 测试 -p 模式
														
 
															-echo "say hello" | bun run src/entrypoints/cli.tsx -p
														
 
															-# 构建
														
 
															-bun run build
														
 
															-```
														
 
															-
														
 
															-| 测试 | 结果 |
														
 
															-|------|------|
														
 
															-| `--version` | `2.1.87 (Claude Code)` |
														
 
															-| `--help` | 完整帮助信息输出 |
														
 
															-| `-p` 模式 | 成功调用 API 返回响应 |
														
 
															-
														
 
															-### TS 类型错误说明
														
 
															-
														
 
															-~~仍有 ~1341 个 tsc 错误~~ → 经过系统性类型修复，已降至 **~294 个**（减少 78%）。剩余错误分散在小文件中，均为反编译产生的源码级类型问题（`unknown`/`never`/`{}`），**不影响 Bun 运行时**。
														
 
															-
														
 
															----
														
 
															-
														
 
															-## 三、关键修复记录
														
 
															-
														
 
															-### 3.1 自动化 stub 生成
														
 
															-
														
 
															-通过 3 个脚本自动处理了缺失模块问题：
														
 
															-- `scripts/create-type-stubs.mjs` — 生成 1206 个 stub 文件
														
 
															-- `scripts/fix-default-stubs.mjs` — 修复 120 个默认导出 stub
														
 
															-- `scripts/fix-missing-exports.mjs` — 补全 81 个模块的 161 个缺失导出
														
 
															-
														
 
															-### 3.2 手动类型修复
														
 
															-
														
 
															-- `src/types/global.d.ts` — MACRO 宏、内部函数声明
														
 
															-- `src/types/internal-modules.d.ts` — `@ant/*` 等私有包类型声明
														
 
															-- `src/entrypoints/sdk/` — 6 个 SDK 子模块 stub
														
 
															-- 泛型类型修复（DeepImmutable、AttachmentMessage 等）
														
 
															-- 4 个 `export const default` 非法语法修复
														
 
															-
														
 
															-### 3.3 运行时修复
														
 
															-
														
 
															-**Commander 非法短标志**：`-d2e, --debug-to-stderr` → `--debug-to-stderr`（反编译错误）
														
 
															-
														
 
															-**`bun:bundle` 运行时 Polyfill**（`src/entrypoints/cli.tsx` 顶部）：
														
 
															-```typescript
														
 
															-const feature = (_name: string) => false;  // 所有 feature flag 分支被跳过
														
 
															-(globalThis as any).MACRO = { VERSION: "2.1.87", ... };  // 绕过版本检查
														
 
															-```
														
 
															-
														
 
															----
														
 
															-
														
 
															-## 四、关键文件清单
														
 
															-
														
 
															-| 文件 | 用途 |
														
 
															-|------|------|
														
 
															-| `src/entrypoints/cli.tsx` | 入口文件（含 MACRO/feature polyfill） |
														
 
															-| `src/main.tsx` | 主 CLI 逻辑（Commander 定义） |
														
 
															-| `src/types/global.d.ts` | 全局变量/宏声明 |
														
 
															-| `src/types/internal-modules.d.ts` | 内部 npm 包类型声明 |
														
 
															-| `src/entrypoints/sdk/*.ts` | SDK 类型 stub |
														
 
															-| `src/types/message.ts` | Message 系列类型 stub |
														
 
															-| `scripts/create-type-stubs.mjs` | 自动 stub 生成脚本 |
														
 
															-| `scripts/fix-default-stubs.mjs` | 修复默认导出 stub |
														
 
															-| `scripts/fix-missing-exports.mjs` | 补全缺失导出 |
														
 
															-
														
 
															----
														
 
															-
														
 
															-## 五、Monorepo 改造（2026-03-31）
														
 
															-
														
 
															-### 5.1 背景
														
 
															-
														
 
															-`color-diff-napi` 原先是手工放在 `node_modules/` 下的 stub 文件，导出的是普通对象而非 class，导致 `new ColorDiff(...)` 报错：
														
 
															-```
														
 
															-ERROR Object is not a constructor (evaluating 'new ColorDiff(patch, firstLine, filePath, fileContent)')
														
 
															-```
														
 
															-同时 `@ant/*`、其他 `*-napi` 包也只有 `declare module` 类型声明，无运行时实现。
														
 
															-
														
 
															-### 5.2 方案
														
 
															-
														
 
															-将项目改造为 **Bun workspaces monorepo**，所有内部包统一放在 `packages/` 下，通过 `workspace:*` 依赖解析。
														
 
															-
														
 
															-### 5.3 创建的 workspace 包
														
 
															-
														
 
															-| 包名 | 路径 | 类型 |
														
 
															-|------|------|------|
														
 
															-| `color-diff-napi` | `packages/color-diff-napi/` | 完整实现（~1000行 TS，从 `src/native-ts/color-diff/` 移入） |
														
 
															-| `modifiers-napi` | `packages/modifiers-napi/` | stub（macOS 修饰键检测） |
														
 
															-| `audio-capture-napi` | `packages/audio-capture-napi/` | stub |
														
 
															-| `image-processor-napi` | `packages/image-processor-napi/` | stub |
														
 
															-| `url-handler-napi` | `packages/url-handler-napi/` | stub |
														
 
															-| `@ant/claude-for-chrome-mcp` | `packages/@ant/claude-for-chrome-mcp/` | stub |
														
 
															-| `@ant/computer-use-mcp` | `packages/@ant/computer-use-mcp/` | stub（含 subpath exports: sentinelApps, types） |
														
 
															-| `@ant/computer-use-input` | `packages/@ant/computer-use-input/` | stub |
														
 
															-| `@ant/computer-use-swift` | `packages/@ant/computer-use-swift/` | stub |
														
 
															-
														
 
															-### 5.4 新增的 npm 依赖
														
 
															-
														
 
															-| 包名 | 原因 |
														
 
															-|------|------|
														
 
															-| `@opentelemetry/semantic-conventions` | 构建报错缺失 |
														
 
															-| `fflate` | `src/utils/dxt/zip.ts` 动态 import |
														
 
															-| `vscode-jsonrpc` | `src/services/lsp/LSPClient.ts` import |
														
 
															-| `@aws-sdk/credential-provider-node` | `src/utils/proxy.ts` 动态 import |
														
 
															-
														
 
															-### 5.5 关键变更
														
 
															-
														
 
															-- `package.json`：添加 `workspaces`，添加所有 workspace 包和缺失 npm 依赖
														
 
															-- `src/types/internal-modules.d.ts`：删除已移入 monorepo 的 `declare module` 块，仅保留 `bun:bundle`、`bun:ffi`、`@anthropic-ai/mcpb`
														
 
															-- `src/native-ts/color-diff/` → `packages/color-diff-napi/src/`：移动并内联了对 `stringWidth` 和 `logError` 的依赖
														
 
															-- 删除 `node_modules/color-diff-napi/` 手工 stub
														
 
															-
														
 
															-### 5.6 构建验证
														
 
															-
														
 
															-```
														
 
															-$ bun run build
														
 
															-Bundled 5326 modules in 491ms
														
 
															-  cli.js  25.74 MB  (entry point)
														
 
															-```
														
 
															-
														
 
															----
														
 
															-
														
 
															-## 六、系统性类型修复（2026-03-31）
														
 
															-
														
 
															-### 6.1 背景
														
 
															-
														
 
															-反编译产生的源码存在 ~1341 个 tsc 类型错误，主要成因：
														
 
															-- `unknown` 类型上的属性访问（714 个，占 54%）
														
 
															-- 类型赋值不兼容（212 个）
														
 
															-- 参数类型不匹配（140 个）
														
 
															-- 不可能的字面量比较（106 个，如 `"external" === 'ant'`）
														
 
															-
														
 
															-### 6.2 修复策略
														
 
															-
														
 
															-通过 4 轮并行 agent（每轮 7 个）系统性修复，**从 1341 降至 ~294**（减少 78%）。
														
 
															-
														
 
															-#### 根因修复（影响面最大）
														
 
															-
														
 
															-| 修复 | 影响 |
														
 
															-|------|------|
														
 
															-| `useAppState<R>` 添加泛型签名 (`AppState.tsx`) | 消除全局大量 `unknown` 返回值 |
														
 
															-| `Message` 类型重构 (`message.ts`) | content 改为 `string \| ContentBlockParam[] \| ContentBlock[]`；添加 `MessageType` 扩展联合；`GroupedToolUseMessage`/`CollapsedReadSearchGroup` 结构化 |
														
 
															-| `SDKAssistantMessageError` 命名冲突修复 (`coreTypes.generated.ts`) | 解决 37 个 errors.ts 类型错误 |
														
 
															-| SDK 消息类型增强 (`coreTypes.generated.ts`) | `SDKAssistantMessage`/`SDKUserMessage` 等添加具体字段声明 |
														
 
															-| `NonNullableUsage` 扩展 (`sdkUtilityTypes.ts`) | 添加 snake_case 属性声明 |
														
 
															-
														
 
															-#### 批量模式修复
														
 
															-
														
 
															-| 模式 | 修复方式 | 数量 |
														
 
															-|------|----------|------|
														
 
															-| `"external" === 'ant'` 编译常量比较 | `("external" as string) === 'ant'` | ~60 处 |
														
 
															-| `unknown` 属性访问 | 精确类型断言（`as SomeType`） | ~400 处 |
														
 
															-| `message.content` union 无法调用数组方法 | `Array.isArray()` 守卫 | ~80 处 |
														
 
															-| stub 包缺失方法/类型 | 补全 stub 类型声明 | ~15 个包 |
														
 
															-
														
 
															-#### Stub 包类型补全
														
 
															-
														
 
															-| 包 | 补全内容 |
														
 
															-|----|----------|
														
 
															-| `@ant/computer-use-swift` | `ComputerUseAPI` 完整接口（apps/display/screenshot） |
														
 
															-| `@ant/computer-use-input` | `ComputerUseInputAPI` 完整接口 |
														
 
															-| `audio-capture-napi` | 4 个函数签名 |
														
 
															-
														
 
															-### 6.3 修复的关键文件
														
 
															-
														
 
															-| 文件 | 修复错误数 |
														
 
															-|------|-----------|
														
 
															-| `src/screens/REPL.tsx` | ~100 |
														
 
															-| `src/utils/hooks.ts` | ~81 |
														
 
															-| `src/utils/sessionStorage.ts` | ~58 |
														
 
															-| `src/components/PromptInput/` | ~45 |
														
 
															-| `src/services/api/errors.ts` | ~37 |
														
 
															-| `src/utils/computerUse/executor.ts` | ~36 |
														
 
															-| `src/utils/messages.ts` | ~83 |
														
 
															-| `src/QueryEngine.ts` | ~39 |
														
 
															-| `src/services/api/claude.ts` | ~35 |
														
 
															-| `src/cli/print.ts` + `structuredIO.ts` | ~46 |
														
 
															-| 其他 ~50 个文件 | ~487 |
														
--- a/docs/REVISION-PLAN.md
+++ b/docs/REVISION-PLAN.md
@@ -0,0 +1,128 @@
 
															+# 文档修正计划
														
 
															+
														
 
															+> 目标：补充源码级洞察，让每篇文档从"概念科普"升级为"逆向工程白皮书"水准。
														
 
															+
														
 
															+---
														
 
															+
														
 
															+## 第一梯队：空壳页，需要大幅重写
														
 
															+
														
 
															+### 1. `safety/sandbox.mdx` — 沙箱机制 ✅ DONE
														
 
															+
														
 
															+**现状**：35 行，只列了"文件系统/网络/进程/时间"四个维度，没有任何实现细节。
														
 
															+
														
 
															+**修正方向**：
														
 
															+- 补充 macOS `sandbox-exec` 的实际调用方式，展示沙箱 profile 的关键片段
														
 
															+- 说明 `getSandboxConfig()` 的判定逻辑：哪些命令走沙箱、哪些跳过
														
 
															+- 补充 `dangerouslyDisableSandbox` 参数的设计权衡
														
 
															+- 加入 Linux 平台的沙箱差异对比（seatbelt vs namespace）
														
 
															+- 展示一次命令执行从权限检查→沙箱包裹→实际执行的完整链路
														
 
															+
														
 
															+---
														
 
															+
														
 
															+### 2. `introduction/what-is-claude-code.mdx` — 什么是 Claude Code ✅ DONE
														
 
															+
														
 
															+**现状**：39 行，纯营销文案，和"普通聊天 AI"的对比表太低级。
														
 
															+
														
 
															+**修正方向**：
														
 
															+- 砍掉"能做什么"的泛泛列表，改为一个具体的端到端示例（从用户输入→系统处理→最终输出）
														
 
															+- 用一张简化架构图替代文字描述，让读者 30 秒建立直觉
														
 
															+- 补充 Claude Code 的技术定位：不是 IDE 插件、不是 Web Chat，而是 terminal-native agentic system
														
 
															+- 加入与 Cursor / Copilot / Aider 等工具的定位差异（架构层面而非功能清单）
														
 
															+
														
 
															+---
														
 
															+
														
 
															+### 3. `introduction/why-this-whitepaper.mdx` — 为什么写这份白皮书 ✅ DONE
														
 
															+
														
 
															+**现状**：40 行，全是空话，四张 Card 只是后续章节标题的预告。
														
 
															+
														
 
															+**修正方向**：
														
 
															+- 明确定位：这是对 Anthropic 官方 CLI 的逆向工程分析，不是官方文档
														
 
															+- 列出逆向过程中发现的 3-5 个最意外/最精妙的设计决策（吊住读者胃口）
														
 
															+- 说明白皮书的阅读路线图：推荐的阅读顺序和每个章节解决什么问题
														
 
															+- 补充"这份白皮书不是什么"——不是使用教程，不是 API 文档
														
 
															+
														
 
															+---
														
 
															+
														
 
															+### 4. `safety/why-safety-matters.mdx` — 为什么安全至关重要 ✅ DONE
														
 
															+
														
 
															+**现状**：40 行，只列了显而易见的风险，"安全 vs 效率的平衡"只有 3 个 bullet。
														
 
															+
														
 
															+**修正方向**：
														
 
															+- 从源码角度展示安全体系的全景图：权限规则 → 沙箱 → Plan Mode → 预算上限 → Hooks 的纵深防御链
														
 
															+- 补充 Claude 自身 System Prompt 中的安全指令（"执行前确认"、"优先可逆操作"等），展示 AI 端的安全约束
														
 
															+- 用真实场景说明"安全 vs 效率"的工程权衡：比如 Read 工具为什么免审批、Bash 工具为什么要逐条确认
														
 
															+- 加入 Prompt Injection 防御的简要说明（tool result 中的恶意内容如何被系统标记）
														
 
															+
														
 
															+---
														
 
															+
														
 
															+## 第二梯队：有骨架但太浅，需要补肉
														
 
															+
														
 
															+### 5. `conversation/streaming.mdx` — 流式响应 ✅ DONE
														
 
															+
														
 
															+**现状**：43 行，只说了"流式好"和 3 行 provider 表。
														
 
															+
														
 
															+**修正方向**：
														
 
															+- 补充 `BetaRawMessageStreamEvent` 的核心事件类型及其含义
														
 
															+- 展示文本 chunk 和 tool_use block 交织的状态机流转
														
 
															+- 说明流式中的错误处理：网络断开、API 限流、token 超限时的重试/降级策略
														
 
															+- 补充 `processStreamEvents()` 的核心逻辑：如何从事件流中分离出文本、工具调用、usage 统计
														
 
															+
														
 
															+---
														
 
															+
														
 
															+### 6. `tools/search-and-navigation.mdx` — 搜索与导航 ✅ DONE
														
 
															+
														
 
															+**现状**：43 行，只说 Glob 和 Grep 存在。
														
 
															+
														
 
															+**修正方向**：
														
 
															+- 补充 ripgrep 二进制的内嵌方式（vendor 目录、平台适配）
														
 
															+- 说明搜索结果的 head_limit 默认 250 的设计原因（token 预算）
														
 
															+- 展示 ToolSearch 的实现：如何用语义匹配在 50+ 工具（含 MCP）中找到最相关的
														
 
															+- 补充 Glob 按修改时间排序的意义：最近修改的文件最可能与当前任务相关
														
 
															+
														
 
															+---
														
 
															+
														
 
															+### 7. `tools/task-management.mdx` — 任务管理 ✅ DONE
														
 
															+
														
 
															+**现状**：50 行，只有流程 Steps 和状态展示的 4 个 bullet。
														
 
															+
														
 
															+**修正方向**：
														
 
															+- 补充任务的数据模型：id / subject / description / status / blockedBy / blocks / owner
														
 
															+- 说明依赖管理的实现：blockedBy 如何阻止任务被认领、完成一个任务后如何自动解锁下游
														
 
															+- 展示任务与 Agent 工具的联动：子 Agent 如何认领任务、报告进度
														
 
															+- 补充 activeForm 字段的 UX 设计：进行中任务的 spinner 动画文案
														
 
															+
														
 
															+---
														
 
															+
														
 
															+### 8. `context/token-budget.mdx` — Token 预算管理 ✅ DONE
														
 
															+
														
 
															+**现状**：55 行，预算控制只有 3 张 Card 各一句话。
														
 
															+
														
 
															+**修正方向**：
														
 
															+- 补充 `contextWindowTokens` 和 `maxOutputTokens` 的动态计算逻辑
														
 
															+- 说明缓存 breakpoint 的放置策略：System Prompt 中不变内容在前、变化内容在后的原因
														
 
															+- 展示工具输出截断的具体机制：超长结果如何被 truncate、何时触发 micro-compact
														
 
															+- 补充 token 计数的实现：`countTokens` 的调用时机和近似 vs 精确计数的权衡
														
 
															+
														
 
															+---
														
 
															+
														
 
															+### 9. `agent/worktree-isolation.mdx` — Worktree 隔离 ✅ DONE
														
 
															+
														
 
															+**现状**：55 行，只描述了 git worktree 的概念。
														
 
															+
														
 
															+**修正方向**：
														
 
															+- 展示 `.claude/worktrees/` 的目录结构和分支命名规则
														
 
															+- 说明 worktree 的生命周期：创建时机（`isolation: "worktree"`）→ 子 Agent 执行 → 完成/放弃 → 自动清理
														
 
															+- 补充 worktree 与子 Agent 的绑定关系：Agent 结束时如何判断 keep or remove
														
 
															+- 加入 EnterWorktree / ExitWorktree 工具的交互设计
														
 
															+
														
 
															+---
														
 
															+
														
 
															+### 10. `extensibility/custom-agents.mdx` — 自定义 Agent ✅ DONE
														
 
															+
														
 
															+**现状**：56 行，只有配置表和示例表。
														
 
															+
														
 
															+**修正方向**：
														
 
															+- 展示 agent markdown 文件的完整 frontmatter 格式（name / description / model / allowedTools 等）
														
 
															+- 说明 agent 如何被加载和注入 System Prompt：`loadAgentDefinitions()` 的发现和合并逻辑
														
 
															+- 展示工具限制的实现：allowedTools 如何过滤工具列表
														
 
															+- 补充 agent 与 subagent_type 参数的关联：Agent 工具如何指定使用自定义 Agent
														
--- a/docs/agent/worktree-isolation.mdx
+++ b/docs/agent/worktree-isolation.mdx
@@ -1,55 +1,179 @@
 
															 ---
														
 
															 title: "Worktree 隔离"
														
 
															-description: "给子 Agent 一个独立的工作空间，互不污染"
														
 
															+description: "给子 Agent 一个独立的工作空间——用 git worktree 实现文件级隔离"
														
 
															 ---
														
 
															-{/* 本章目标：解释 git worktree 在多 Agent 协作中的作用 */}
														
 
															+{/* 本章目标：揭示 worktree 的创建/销毁生命周期、路径命名规则、hook 机制和退出时的安全防护 */}
														
 
															-## 问题：多个 Agent 改同一份代码
														
 
															+## 为什么需要文件级隔离
														
 
															-当多个 Agent 同时修改项目文件时，冲突在所难免：
														
 
															+多 Agent 并行工作时，共享同一工作目录会导致三类冲突：
														
 
															-- Agent A 修改了 `config.ts`，Agent B 也在改同一个文件
														
 
															-- Agent A 的测试需要某个状态，Agent B 的修改破坏了它
														
 
															-- 半完成的修改混在一起，无法分辨哪些是哪个 Agent 做的
														
 
															+1. **写入冲突**：两个 Agent 同时编辑 `config.ts`，后写的覆盖前写的
														
 
															+2. **状态干扰**：Agent A 的测试依赖某个环境状态，Agent B 的修改破坏了它
														
 
															+3. **不可区分**：半完成的修改混在一起，无法分辨哪些是哪个 Agent 的
														
 
															-## 解决方案：Git Worktree
														
 
															+Git worktree 是 git 原生的解决方案——在同一个仓库中创建多个独立工作目录，每个在自己的分支上。
														
 
															-Git 原生支持 **worktree**（工作树）——在同一个仓库中创建多个独立的工作目录，每个目录在自己的分支上独立工作。
														
 
															+## 目录结构与命名规则
														
 
															-Claude Code 利用这个特性为子 Agent 提供隔离的工作空间：
														
 
															+Worktree 文件统一存放在仓库根目录下的 `.claude/worktrees/`：
														
 
															-| | 共享工作目录 | Worktree 隔离 |
														
 
															-|---|---|---|
														
 
															-| 文件冲突 | 多个 Agent 可能互相覆盖 | 每个 Agent 在自己的目录中工作 |
														
 
															-| 分支 | 都在同一个分支上 | 每个 Agent 有自己的分支 |
														
 
															-| 测试 | 互相干扰 | 完全独立 |
														
 
															-| 合并 | 需要手动处理冲突 | 通过 git merge 有序合并 |
														
 
															+```
														
 
															+<repo-root>/
														
 
															+├── .claude/
														
 
															+│   └── worktrees/
														
 
															+│       ├── fix-auth-bug/          # worktree 工作目录
														
 
															+│       │   ├── .git               # 指向主仓库的链接文件
														
 
															+│       │   └── src/...            # 独立的文件系统视图
														
 
															+│       └── add-dark-mode/         # 另一个 worktree
														
 
															+│           └── ...
														
 
															+├── src/                           # 主工作目录（不受影响）
														
 
															+└── .git/                          # 主仓库
														
 
															+```
														
 
															-## 工作流程
														
 
															+分支命名规则为 `worktree/<slug>`，其中 slug 由 `validateWorktreeSlug()` 校验：每个 `/` 分隔的段只允许字母、数字、`.`、`_`、`-`，总长 ≤64 字符。未指定时使用 plan slug 自动生成。
														
 
															-<Steps>
														
 
															-  <Step title="创建 Worktree">
														
 
															-    AI 启动带隔离模式的子 Agent，系统自动在 `.claude/worktrees/` 下创建新的工作目录
														
 
															-  </Step>
														
 
															-  <Step title="独立工作">
														
 
															-    子 Agent 在自己的 worktree 中自由修改文件、执行命令
														
 
															-  </Step>
														
 
															-  <Step title="完成任务">
														
 
															-    子 Agent 完成后，变更留在 worktree 的分支上
														
 
															-  </Step>
														
 
															-  <Step title="合并或丢弃">
														
 
															-    主 Agent（或用户）决定：合并这些变更到主分支，还是丢弃
														
 
															-  </Step>
														
 
															-  <Step title="清理">
														
 
															-    不再需要的 worktree 会被自动清理
														
 
															-  </Step>
														
 
															-</Steps>
														
 
															+## 创建流程：EnterWorktreeTool
														
 
															-## 安全网
														
 
															+`EnterWorktreeTool`（`src/tools/EnterWorktreeTool/EnterWorktreeTool.ts`）的执行链路：
														
 
															-Worktree 还充当了一个安全网：
														
 
															+```
														
 
															+EnterWorktreeTool.call({ name? })
														
 
															+  ↓
														
 
															+1. 检查是否已在 worktree 中（防嵌套）
														
 
															+  ↓
														
 
															+2. 解析到主仓库根目录（findCanonicalGitRoot）
														
 
															+   如果当前已在 worktree 内，chdir 到主仓库
														
 
															+  ↓
														
 
															+3. 生成 slug（用户提供或 plan slug）
														
 
															+  ↓
														
 
															+4. createWorktreeForSession(sessionId, slug)
														
 
															+   ├── 有 WorktreeCreate hook？
														
 
															+   │   └── 执行 hook，返回 hook 指定的路径（支持非 git VCS）
														
 
															+   └── 无 hook → git 原生路径：
														
 
															+       a. getOrCreateWorktree(repoRoot, slug)
														
 
															+          ├── 快速恢复：检查 worktree 目录是否已存在
														
 
															+          │   └── 读取 .git 指针文件的 HEAD SHA（无子进程）
														
 
															+          └── 新建：
														
 
															+              i.   mkdir .claude/worktrees/（recursive）
														
 
															+              ii.  fetch origin/<default-branch>（有缓存则跳过）
														
 
															+              iii. git worktree add -b worktree/<slug> <path> <base>
														
 
															+              iv.  performPostCreationSetup()（sparse checkout 等）
														
 
															+  ↓
														
 
															+5. 更新进程状态：
														
 
															+   - process.chdir(worktreePath)
														
 
															+   - setCwd(worktreePath)
														
 
															+   - setOriginalCwd(worktreePath)
														
 
															+   - saveWorktreeState(session) → 持久化到项目配置
														
 
															+   - clearSystemPromptSections() → 重新计算系统提示中的 cwd 信息
														
 
															+   - clearMemoryFileCaches() → 重新加载 worktree 中的 CLAUDE.md
														
 
															+  ↓
														
 
															+6. 返回 worktreePath 和 worktreeBranch
														
 
															+```
														
 
															-- 子 Agent 的实验性修改不会影响主分支
														
 
															-- 如果方案不可行，整个 worktree 可以直接丢弃
														
 
															-- 多个方案可以在不同 worktree 中并行尝试，最后选最好的
														
 
															+### Hook 优先的架构
														
 
															+
														
 
															+`createWorktreeForSession()` 首先检查 `hasWorktreeCreateHook()`——如果用户在 settings.json 中配置了 `WorktreeCreate` hook，系统完全不调用 git，而是执行 hook 命令并将返回的路径作为 worktree 路径。这允许非 git 版本控制系统（如 Pijul、Mercurial）通过 hook 接入。
														
 
															+
														
 
															+### 快速恢复路径
														
 
															+
														
 
															+`getOrCreateWorktree()` 有一个关键优化：如果目标路径已存在，直接读取 `.git` 指针文件获取 HEAD SHA（纯文件 I/O，无子进程），跳过整个 `fetch` + `worktree add` 流程。在大仓库中 `fetch` 需要 6-8 秒，这个优化将恢复场景的延迟降到接近 0。
														
 
															+
														
 
															+## 退出流程：ExitWorktreeTool
														
 
															+
														
 
															+`ExitWorktreeTool`（`src/tools/ExitWorktreeTool/ExitWorktreeTool.ts`）支持两种退出策略：
														
 
															+
														
 
															+### keep：保留 worktree
														
 
															+
														
 
															+```
														
 
															+keepWorktree()
														
 
															+  ↓
														
 
															+1. chdir 回 originalCwd
														
 
															+2. 清空 currentWorktreeSession
														
 
															+3. 更新项目配置（activeWorktreeSession = undefined）
														
 
															+4. worktree 目录和分支保留在磁盘上
														
 
															+```
														
 
															+
														
 
															+用户可以通过 `cd <worktreePath>` 继续工作，或稍后手动合并。
														
 
															+
														
 
															+### remove：删除 worktree
														
 
															+
														
 
															+有严格的**安全防护**：
														
 
															+
														
 
															+```
														
 
															+validateInput() — 第一道防线
														
 
															+  ↓
														
 
															+1. 检查是否在 EnterWorktree 创建的会话中
														
 
															+   （手动创建的 worktree 不会被删除）
														
 
															+  ↓
														
 
															+2. countWorktreeChanges(worktreePath, originalHeadCommit)
														
 
															+   ├── git status --porcelain → 统计未提交文件数
														
 
															+   ├── git rev-list --count <originalHead>..HEAD → 统计新提交数
														
 
															+   └── 返回 null（git 失败时）→ fail-closed（拒绝删除）
														
 
															+  ↓
														
 
															+3. 有未提交文件或新提交？
														
 
															+   → 拒绝，要求 discard_changes: true 确认
														
 
															+```
														
 
															+
														
 
															+```
														
 
															+call() — 实际执行
														
 
															+  ↓
														
 
															+1. 重新计数变更（validateInput 和 call 之间可能有新修改）
														
 
															+2. 如果有 tmux session → killTmuxSession()
														
 
															+3. cleanupWorktree()
														
 
															+   ├── hook-based → 执行 WorktreeRemove hook
														
 
															+   └── git-based → git worktree remove --force + git branch -D
														
 
															+4. restoreSessionToOriginalCwd()
														
 
															+   - setCwd(originalCwd)
														
 
															+   - setOriginalCwd(originalCwd)
														
 
															+   - 如果 projectRoot 是 worktree 时才恢复（防误触）
														
 
															+   - 更新 hooks config snapshot
														
 
															+   - 清空系统提示和 memory 缓存
														
 
															+```
														
 
															+
														
 
															+### fail-closed 设计
														
 
															+
														
 
															+`countWorktreeChanges()` 在以下情况返回 `null`（"未知，假设不安全"）：
														
 
															+- `git status` 或 `git rev-list` 退出非零（锁文件、损坏的索引）
														
 
															+- `originalHeadCommit` 未定义（hook-based worktree 没有设置基线 commit）
														
 
															+
														
 
															+返回 `null` 时，`validateInput` 拒绝删除——宁可让用户手动处理，也不冒险丢失工作。
														
 
															+
														
 
															+## 与 Agent 工具的联动
														
 
															+
														
 
															+Agent 工具（`AgentTool`）的 `isolation` 参数决定子 Agent 是否在 worktree 中运行：
														
 
															+
														
 
															+- `isolation: "worktree"` → 调用 `createWorktreeForSession()`，子 Agent 在独立 worktree 中执行
														
 
															+- 无 isolation → 子 Agent 共享主工作目录
														
 
															+
														
 
															+子 Agent 结束时的处理：
														
 
															+- **成功**：主 Agent 通过 `ExitWorktreeTool(action: "keep")` 保留 worktree，然后手动合并
														
 
															+- **失败/放弃**：主 Agent 通过 `ExitWorktreeTool(action: "remove", discard_changes: true)` 清理
														
 
															+
														
 
															+## Session 状态持久化
														
 
															+
														
 
															+`WorktreeSession` 对象通过 `saveCurrentProjectConfig()` 持久化到磁盘，包含：
														
 
															+
														
 
															+```typescript
														
 
															+{
														
 
															+  originalCwd: string,         // 进入 worktree 前的工作目录
														
 
															+  worktreePath: string,        // worktree 的绝对路径
														
 
															+  worktreeName: string,        // slug
														
 
															+  worktreeBranch?: string,     // 分支名（如 worktree/fix-auth）
														
 
															+  originalBranch?: string,     // 进入前的分支
														
 
															+  originalHeadCommit?: string, // 进入前的 HEAD commit（用于变更统计）
														
 
															+  sessionId: string,           // 创建此 worktree 的会话 ID
														
 
															+  tmuxSessionName?: string,    // 关联的 tmux session
														
 
															+  hookBased?: boolean,         // 是否由 hook 创建
														
 
															+  creationDurationMs?: number, // 创建耗时（分析用）
														
 
															+}
														
 
															+```
														
 
															+
														
 
															+这使得 session 恢复（`--resume`）时能正确还原 worktree 上下文——即使进程重启，`getCurrentWorktreeSession()` 从项目配置中读取状态。
														
 
															+
														
 
															+## Sparse Checkout 优化
														
 
															+
														
 
															+对于大型 monorepo，worktree 支持 `sparsePaths` 配置——只检出特定目录而非整个仓库。这在 210K 文件的仓库中将 worktree 创建时间从数十秒降到几秒。
														
 
															+
														
 
															+配置位于 `getInitialSettings().worktree?.sparsePaths`，在 `performPostCreationSetup()` 中应用。
														
--- a/docs/context/token-budget.mdx
+++ b/docs/context/token-budget.mdx
@@ -1,55 +1,167 @@
 
															 ---
														
 
															 title: "Token 预算管理"
														
 
															-description: "精打细算每一个 token——AI 的'注意力'是有限资源"
														
 
															+description: "上下文窗口是 AI 的内存条——满了就得压缩"
														
 
															 ---
														
 
															-{/* 本章目标：解释 token 预算管理的思路 */}
														
 
															+{/* 本章目标：从源码角度揭示 token 预算的动态计算、截断机制、缓存优化和自动压缩的完整链路 */}
														
 
															-## Token 是什么
														
 
															+## 上下文窗口：200K 不是全部
														
 
															-简单理解：token 约等于一个英文单词或半个中文字。AI 处理的所有输入和输出都按 token 计费。
														
 
															+Claude Code 的默认上下文窗口为 200K tokens（`MODEL_CONTEXT_WINDOW_DEFAULT = 200_000`），但实际可用于对话的空间远小于此：
														
 
															-| 类型 | 说明 | 谁付费 |
														
 
															-|------|------|--------|
														
 
															-| 输入 token | 发给 AI 的所有内容（System Prompt + 对话历史 + 工具结果） | 用户 |
														
 
															-| 输出 token | AI 生成的回复和工具调用 | 用户 |
														
 
															-| 缓存 token | 重复发送的内容如果命中缓存，价格更低 | 部分用户 |
														
 
															+```
														
 
															+上下文窗口（200K）
														
 
															+├── 系统提示词（~15-25K，缓存后成本低）
														
 
															+├── 工具定义（~10-20K，含 MCP 工具）
														
 
															+├── 用户上下文（CLAUDE.md、git status 等）
														
 
															+├── 输出预留（maxOutputTokens）
														
 
															+│   ├── 默认上限：64K
														
 
															+│   ├── 实际默认：8K（slot-reservation 优化）
														
 
															+│   └── 触顶自动升级：一次 64K 重试
														
 
															+└── 剩余：对话历史空间（随对话增长）
														
 
															+```
														
 
															-## 预算控制的三个层面
														
 
															+`getContextWindowForModel()`（`src/utils/context.ts:51`）按 5 级优先级解析窗口大小：
														
 
															-<CardGroup cols={3}>
														
 
															-  <Card title="单次请求" icon="1">
														
 
															-    每次 API 调用的最大输入/输出 token
														
 
															-  </Card>
														
 
															-  <Card title="单轮对话" icon="arrows-rotate">
														
 
															-    一个 Agentic Loop 内的累计 token 消耗
														
 
															-  </Card>
														
 
															-  <Card title="整个会话" icon="clock">
														
 
															-    全部对话轮次的累计花费（美元）
														
 
															-  </Card>
														
 
															-</CardGroup>
														
 
															+1. `CLAUDE_CODE_MAX_CONTEXT_TOKENS` 环境变量覆盖
														
 
															+2. 模型名含 `[1m]` 后缀 → 1M tokens
														
 
															+3. `getModelCapability(model).max_input_tokens`
														
 
															+4. 1M beta header + 支持的模型（claude-sonnet-4, opus-4-6）
														
 
															+5. 兜底：200K
														
 
															-## 工具输出的预算控制
														
 
															+**有效上下文** = 窗口大小 - min(maxOutputTokens, 20K)，因为压缩摘要需要预留输出空间。
														
 
															-工具返回的内容可能非常长（一个大文件、一段长日志），直接全部塞给 AI 会浪费大量 token。系统对此有专门的控制：
														
 
															+## Token 计数：近似 vs 精确
														
 
															-- **结果截断**：超过长度限制的工具输出自动截断
														
 
															-- **结果替换**：已经被 AI"消化"过的旧工具结果，可以被替换为简短的摘要
														
 
															-- **按需读取**：大文件不一次性读完，AI 可以指定读取范围
														
 
															+系统使用两级 token 计数策略：
														
 
															-## 缓存的经济学
														
 
															+### 近似估算（毫秒级）
														
 
															-System Prompt 每次都要发送，但大部分内容不变。缓存机制让这部分"免费"（或大幅降价）：
														
 
															+```typescript
														
 
															+// src/services/tokenEstimation.ts
														
 
															+function roughTokenCountEstimation(content: string, bytesPerToken = 4): number {
														
 
															+  return Math.round(content.length / bytesPerToken)
														
 
															+}
														
 
															+```
														
 
															-- 首次发送：全价
														
 
															-- 后续请求命中缓存：约 1/10 的价格
														
 
															-- 这就是为什么 System Prompt 的结构被精心设计——不变的部分放前面，变化的部分放后面
														
 
															+对不同内容类型有特殊处理：
														
 
															+- **JSON/JSONL**：`bytesPerToken = 2`（密集的 `{`, `:`, `,` 符号，每个仅 1-2 token）
														
 
															+- **图片/文档**：固定 2000 tokens（基于 2000×2000px 上限的保守估计）
														
 
															+- **thinking block**：按实际文本长度 / 4
														
 
															+- **tool_use**：序列化 `name + JSON.stringify(input)` 后 / 4
														
 
															-## token 警告与自动压缩
														
 
															+### 精确计数（API 调用）
														
 
															-| token 使用率 | 系统行为 |
														
 
															-|-------------|---------|
														
 
															-| < 70% | 正常运行 |
														
 
															-| 70% ~ 90% | 显示警告，提示用户可以手动压缩 |
														
 
															-| > 90% | 自动触发压缩 |
														
 
															-| 接近 100% | 强制压缩或终止当前轮次 |
														
 
															+使用 Anthropic 的 `beta.messages.countTokens` 端点。在不同 provider 上有不同路径：
														
 
															+
														
 
															+| Provider | 方法 |
														
 
															+|----------|------|
														
 
															+| Anthropic 直连 | `anthropic.beta.messages.countTokens()` |
														
 
															+| AWS Bedrock | `@aws-sdk/client-bedrock-runtime` 的 `CountTokensCommand` |
														
 
															+| Google Vertex | Anthropic SDK + beta 过滤 |
														
 
															+| 兜底（Bedrock 不支持） | 用 Haiku 发送 `max_tokens=1` 的请求，读取 `usage.input_tokens` |
														
 
															+
														
 
															+精确计数在关键决策点使用（压缩前后对比、warning 判断），近似估算在热路径使用（每轮循环的 shouldAutoCompact 检查）。
														
 
															+
														
 
															+## 自动压缩的触发阈值
														
 
															+
														
 
															+```
														
 
															+src/services/compact/autoCompact.ts — 核心阈值
														
 
															+```
														
 
															+
														
 
															+| 常量 | 值 | 含义 |
														
 
															+|------|----|------|
														
 
															+| `AUTOCOMPACT_BUFFER_TOKENS` | 13,000 | 窗口减去此值 = 自动压缩触发点 |
														
 
															+| `WARNING_THRESHOLD_BUFFER_TOKENS` | 20,000 | 在触发点 + 20K 处显示警告 |
														
 
															+| `ERROR_THRESHOLD_BUFFER_TOKENS` | 20,000 | 在触发点 + 20K 处显示错误 |
														
 
															+| `MANUAL_COMPACT_BUFFER_TOKENS` | 3,000 | 手动 /compact 的阻塞上限 |
														
 
															+| `MAX_CONSECUTIVE_AUTOCOMPACT_FAILURES` | 3 | 连续失败 3 次后停止尝试 |
														
 
															+
														
 
															+以 200K 窗口为例：
														
 
															+- **~167K**：warning 闪烁，用户看到建议压缩的提示
														
 
															+- **~180K**：自动压缩触发（200K - 20K 输出预留 = 180K 有效，再 - 13K buffer）
														
 
															+- **~197K**：达到 blocking limit，新消息被阻止
														
 
															+
														
 
															+`shouldAutoCompact()` 有多个逃逸条件：
														
 
															+- `compact` / `session_memory` 来源的查询永不触发（防递归死锁）
														
 
															+- `DISABLE_COMPACT` / `DISABLE_AUTO_COMPACT` 环境变量
														
 
															+- 用户配置 `autoCompactEnabled = false`
														
 
															+- Context Collapse 模式激活时抑制（collapse 自己管理上下文）
														
 
															+- Reactive Compact 实验模式下抑制主动压缩
														
 
															+- 超过连续失败上限（circuit breaker）
														
 
															+
														
 
															+## Micro-Compact：工具结果的渐进式压缩
														
 
															+
														
 
															+在触发全量压缩之前，系统先尝试 **micro-compact**——只压缩旧的工具调用结果：
														
 
															+
														
 
															+```
														
 
															+可压缩工具列表（COMPACTABLE_TOOLS）：
														
 
															+FileRead, Bash, Grep, Glob, WebSearch, WebFetch, FileEdit, FileWrite
														
 
															+```
														
 
															+
														
 
															+策略基于时间：
														
 
															+- 超过一定时间（由 `timeBasedMCConfig` 控制）的工具结果被替换为简短占位符
														
 
															+- 图片/文档结果替换为 `[image]` / `[document]` 文本
														
 
															+- 每次替换释放 tokens，可能推迟全量压缩
														
 
															+
														
 
															+工具本身也有 `maxResultSizeChars`（通常 100K）硬限制，超长结果在写入消息前就被截断。
														
 
															+
														
 
															+## 全量压缩的完整流程
														
 
															+
														
 
															+```
														
 
															+autoCompactIfNeeded() / compactConversation()
														
 
															+  ↓
														
 
															+1. 执行 PreCompact hooks（外部可注入自定义指令）
														
 
															+  ↓
														
 
															+2. 尝试 Session Memory 压缩（更轻量，优先尝试）
														
 
															+  ↓
														
 
															+3. Session Memory 失败 → 全量压缩
														
 
															+   a. 图片/文档从消息中剥离（替换为 [image]/[document]）
														
 
															+   b. skill_discovery/skill_listing 附件剥离（压缩后会重新注入）
														
 
															+   c. 通过 forked agent 发送摘要请求（复用主线程的 prompt cache）
														
 
															+   d. 如果摘要请求本身触发 prompt-too-long → truncateHeadForPTLRetry()
														
 
															+      从最老的 API 轮次开始删除，重试最多 3 次
														
 
															+   ↓
														
 
															+4. 压缩成功后重建上下文：
														
 
															+   - compactBoundaryMarker（记录压缩类型、前 token 数等）
														
 
															+   - 摘要消息（不可见的 user 消息）
														
 
															+   - 最近 5 个文件的重新读取（POST_COMPACT_TOKEN_BUDGET = 50K）
														
 
															+   - plan 文件附件（如果有）
														
 
															+   - plan mode 指令（如果在计划模式中）
														
 
															+   - 已调用的 skill 内容（每 skill ≤5K，总计 ≤25K）
														
 
															+   - deferred tools / agent listing / MCP 指令的增量重新注入
														
 
															+   - SessionStart hooks 重新执行
														
 
															+   - PostCompact hooks 执行
														
 
															+  ↓
														
 
															+5. 更新缓存基线，防止被误判为 cache break
														
 
															+```
														
 
															+
														
 
															+### Prompt Cache Sharing
														
 
															+
														
 
															+压缩 API 调用是整个会话中最昂贵的操作之一。系统通过 `runForkedAgent` 复用主线程的缓存前缀（system prompt + tools + context messages），将缓存命中率从 2% 提升到接近 100%。这个优化单独节省了舰队级约 0.76% 的 `cache_creation` tokens。
														
 
															+
														
 
															+## 输出 Token 的 Slot 优化
														
 
															+
														
 
															+一个经常被忽视的优化：**maxOutputTokens 的动态调整**。
														
 
															+
														
 
															+```typescript
														
 
															+// src/services/api/claude.ts — getMaxOutputTokensForModel()
														
 
															+const defaultTokens = isMaxTokensCapEnabled()
														
 
															+  ? Math.min(maxOutputTokens.default, 8_000)  // 默认降到 8K
														
 
															+  : maxOutputTokens.default                     // 原始默认 32K/64K
														
 
															+```
														
 
															+
														
 
															+为什么？因为 API 的 slot 机制按 `max_tokens` 预留推理容量。BQ p99 输出仅 4,911 tokens，32K 默认值浪费了 8-16 倍的 slot 容量。降到 8K 后，不到 1% 的请求被截断——这些请求会自动获得一次 64K 的 clean retry。
														
 
															+
														
 
															+这个优化对 token 预算的影响是间接的：更多的 slot 容量意味着更少的排队延迟，间接减少了超时和重试。
														
 
															+
														
 
															+## Partial Compact：选择性地压缩
														
 
															+
														
 
															+除了全量压缩，用户还可以在消息历史中选择某个位置，只压缩该位置之前或之后的内容：
														
 
															+
														
 
															+- **`up_to` 方向**：压缩选中消息之前的内容，保留最近的对话
														
 
															+- **`from` 方向**：压缩选中消息之后的内容，保留早期的对话
														
 
															+
														
 
															+`from` 方向保留 prompt cache（前缀不变），`up_to` 方向则破坏 cache（摘要插在保留内容之前）。
														
 
															+
														
 
															+两种方向的 PTL（prompt-too-long）重试策略相同：从最老的 API 轮次开始删除，确保至少保留一组消息供摘要。
														
--- a/docs/conversation/streaming.mdx
+++ b/docs/conversation/streaming.mdx
@@ -3,8 +3,6 @@ title: "流式响应：逐字呈现"
 
															 description: "为什么 Claude Code 的回答是'打字机效果'而不是一整块弹出"
														
 
															 ---
														
 
															-{/* 本章目标：解释流式通信的意义和它如何与工具执行交织 */}
														
 
															-
														
 
															 ## 为什么需要流式
														
 
															 想象 AI 需要 30 秒才能生成完整回答——如果等 30 秒后才一次性显示，用户体验是灾难性的。
														
@@ -14,30 +12,171 @@ description: "为什么 Claude Code 的回答是'打字机效果'而不是一整
 
															 - 工具调用的参数在生成过程中就能预览
														
 
															 - 长时间任务不会让用户觉得"卡死了"
														
 
															-## 流式与工具调用的交织
														
 
															+## `BetaRawMessageStreamEvent` 核心事件类型
														
 
															+
														
 
															+流式 API 返回的是一系列 `BetaRawMessageStreamEvent`，每种事件类型对应流式响应的不同阶段（`src/services/api/claude.ts`）：
														
 
															+
														
 
															+```
														
 
															+message_start           ← 消息开始，包含 model、usage 初始值
														
 
															+  ├── content_block_start   ← 内容块开始（text / tool_use / thinking）
														
 
															+  │   ├── content_block_delta  ← 增量数据（text_delta / input_json_delta / thinking_delta）
														
 
															+  │   ├── content_block_delta  ← ... 持续到达
														
 
															+  │   └── content_block_stop   ← 内容块结束，yield AssistantMessage
														
 
															+  ├── content_block_start   ← 下一个内容块...
														
 
															+  │   └── ...
														
 
															+  └── message_delta       ← stop_reason + 最终 usage
														
 
															+message_stop            ← 消息结束
														
 
															+```
														
 
															+
														
 
															+### 事件处理状态机
														
 
															+
														
 
															+`src/services/api/claude.ts:1980-2298` 实现了一个基于 `switch(part.type)` 的状态机：
														
 
															+
														
 
															+| 事件类型 | 处理逻辑 | 状态变更 |
														
 
															+|----------|----------|----------|
														
 
															+| `message_start` | 初始化 `partialMessage`，记录 TTFT（首字节延迟） | `usage` 初始化 |
														
 
															+| `content_block_start` | 按 `part.index` 创建对应类型的内容块 | `contentBlocks[index]` 初始化 |
														
 
															+| `content_block_delta` | 按子类型增量追加数据 | text / thinking / input 累加 |
														
 
															+| `content_block_stop` | 构建完整 `AssistantMessage` 并 yield | 消息推入 `newMessages` |
														
 
															+| `message_delta` | 更新 stop_reason 和最终 usage | 写回最后一条消息 |
														
 
															+| `message_stop` | 无操作（流结束标记） | — |
														
 
															+
														
 
															+### 内容块类型及其增量数据
														
 
															+
														
 
															+`content_block_start` 中的 `content_block.type` 决定了如何处理后续 delta：
														
 
															+
														
 
															+| 内容块类型 | Delta 类型 | 累加逻辑 |
														
 
															+|-----------|-----------|----------|
														
 
															+| `text` | `text_delta` | `text += delta.text` |
														
 
															+| `thinking` | `thinking_delta` + `signature_delta` | `thinking += delta.thinking`，`signature = delta.signature` |
														
 
															+| `tool_use` | `input_json_delta` | `input += delta.partial_json`（JSON 字符串增量拼接） |
														
 
															+| `server_tool_use` | `input_json_delta` | 同 tool_use |
														
 
															+| `connector_text` | `connector_text_delta` | 特殊连接器文本（feature flag 控制） |
														
 
															+
														
 
															+关键设计：`content_block_start` 时所有文本字段初始化为空字符串，只通过 `content_block_delta` 累加。这是因为 SDK 有时在 start 和 delta 中重复发送相同文本。
														
 
															+
														
 
															+## 文本 chunk 和 tool_use block 的交织
														
 
															+
														
 
															+一次 AI 响应可能包含多个内容块，交替出现：
														
 
															+
														
 
															+```
														
 
															+content_block_start (text, index=0)     "我来帮你修复这个 bug。"
														
 
															+content_block_delta  (text_delta)       "首先..."
														
 
															+content_block_stop  (index=0)
														
 
															+content_block_start (tool_use, index=1) { name: "Read", input: "..." }
														
 
															+content_block_delta  (input_json_delta) '{"file_p' → 'ath":' → '"src/foo.ts"}'
														
 
															+content_block_stop  (index=1)
														
 
															+content_block_start (text, index=2)     "我已经看到了问题所在..."
														
 
															+content_block_stop  (index=2)
														
 
															+```
														
 
															+
														
 
															+每个 `content_block_stop` 触发一次 `yield`，将完整的 AssistantMessage 推送给消费者。这意味着一个 AI 响应会产生**多条** `AssistantMessage`——文本消息和工具调用消息交替产出。
														
 
															+
														
 
															+`stop_reason` 要等到 `message_delta` 才确定（可能是 `end_turn`、`tool_use`、`max_tokens` 等），所以最后一条消息的 `stop_reason` 是**回写**的：
														
 
															+
														
 
															+```typescript
														
 
															+// claude.ts:2246 — 直接属性修改，不用对象替换
														
 
															+// 因为 transcript 写队列持有 message.message 的引用
														
 
															+const lastMsg = newMessages.at(-1)
														
 
															+if (lastMsg) {
														
 
															+  lastMsg.message.usage = usage
														
 
															+  lastMsg.message.stop_reason = stopReason
														
 
															+}
														
 
															+```
														
 
															+
														
 
															+## 流式中的错误处理
														
 
															-一次 AI 响应中可能同时包含文字和工具调用。流式系统需要处理这种交织：
														
 
															+### 网络断开
														
 
															-<Frame caption="流式输出与工具调用的交织时间线">
														
 
															-  <img src="/docs/images/streaming-timeline.png" alt="流式响应时间线" />
														
 
															-</Frame>
														
 
															+流式连接依赖 SSE（Server-Sent Events）。当连接中断时：
														
 
															-## 流式工具执行
														
 
															+1. **Stream idle watchdog**：定时检测事件间隔，超过阈值（stall）触发告警和重试
														
 
															+2. **Stream abort**：如果 watchdog 检测到长时间无事件，抛出错误进入重试流程
														
 
															+3. **非流式降级**：作为最后手段，回退到非流式请求（一次性获取完整响应）
														
 
															-更进阶的是，**工具本身的执行也可以是流式的**：
														
 
															+```typescript
														
 
															+// claude.ts:2338-2355 — 检测空流
														
 
															+// 1. 完全没有事件 → 代理返回了非 SSE 响应
														
 
															+// 2. 有 message_start 但没有 content_block_stop → 流被截断
														
 
															+```
														
 
															-- 运行一个长命令（比如 `npm install`），输出逐行显示
														
 
															-- 搜索大型项目时，匹配结果逐条呈现
														
 
															-- AI 在等待工具结果的同时，已经开始规划下一步
														
 
															+### API 限流
														
 
															+
														
 
															+当 API 返回限流错误时，系统使用 `withRetry` 包装器进行指数退避重试。重试逻辑考虑了：
														
 
															+- 错误类型（429 限流 vs 500 服务器错误）
														
 
															+- 重试次数上限
														
 
															+- 退避间隔
														
 
															+
														
 
															+### Token 超限
														
 
															+
														
 
															+两种 token 超限场景有不同的处理：
														
 
															+
														
 
															+| 场景 | stop_reason | 处理方式 |
														
 
															+|------|------------|----------|
														
 
															+| **输出超限** | `max_tokens` | 生成错误消息，建议设置 `CLAUDE_CODE_MAX_OUTPUT_TOKENS` |
														
 
															+| **上下文窗口超限** | `model_context_window_exceeded` | 触发 compaction 压缩对话历史后重试 |
														
 
															+
														
 
															+```typescript
														
 
															+// claude.ts:2267-2293
														
 
															+if (stopReason === 'max_tokens') {
														
 
															+  yield createAssistantAPIErrorMessage({ error: 'max_output_tokens', ... })
														
 
															+}
														
 
															+if (stopReason === 'model_context_window_exceeded') {
														
 
															+  // 复用 max_output_tokens 的恢复路径
														
 
															+  yield createAssistantAPIErrorMessage({ error: 'max_output_tokens', ... })
														
 
															+}
														
 
															+```
														
 
															+
														
 
															+### 流式停滞检测
														
 
															+
														
 
															+系统持续监控事件到达间隔，检测"停滞"（stall）：
														
 
															+
														
 
															+```typescript
														
 
															+// claude.ts:1940-1966
														
 
															+const STALL_THRESHOLD_MS = 10_000  // 10 秒无事件视为停滞
														
 
															+if (timeSinceLastEvent > STALL_THRESHOLD_MS) {
														
 
															+  stallCount++
														
 
															+  totalStallTime += timeSinceLastEvent
														
 
															+  logEvent('tengu_streaming_stall', { stall_duration_ms, stall_count, ... })
														
 
															+}
														
 
															+```
														
 
															+
														
 
															+多个 stall 累积后，watchdog 可能决定中断流并触发重试。
														
 
															+
														
 
															+## 工具执行的流式反馈
														
 
															+
														
 
															+BashTool 的命令执行也是流式的——通过 `onProgress` 回调逐行推送输出：
														
 
															+
														
 
															+```
														
 
															+BashTool.call() → runShellCommand() → AsyncGenerator
														
 
															+  ├── 每秒轮询输出文件 → onProgress(lastLines, allLines, ...)
														
 
															+  ├── yield { type: 'progress', output, fullOutput, elapsedTimeSeconds }
														
 
															+  └── return { code, stdout, interrupted, ... }
														
 
															+```
														
 
															+
														
 
															+UI 层通过 `useToolCallProgress` hook 实时展示命令输出，而不是等命令完全结束。长时间运行的命令还支持自动后台化（`shouldAutoBackground`）。
														
 
															 ## 多 Provider 适配
														
 
															-Claude Code 支持多个 AI 服务提供商，每个提供商的流式协议略有不同：
														
 
															+| Provider | 流式协议 | 特殊处理 |
														
 
															+|----------|----------|----------|
														
 
															+| **Anthropic Direct** | 原生 SSE | 延迟最低，TTFT 最快 |
														
 
															+| **AWS Bedrock** | AWS SDK 流式接口 | 需要额外的 beta header 和认证 |
														
 
															+| **Google Vertex** | gRPC → 事件流 | 通过 `getMergedBetas()` 适配 |
														
 
															+| **Azure** | Anthropic 兼容 API | 自定义 base URL |
														
 
															+
														
 
															+所有 Provider 通过统一的 `Stream<BetaRawMessageStreamEvent>` 抽象层屏蔽差异。上层代码（QueryEngine、REPL）不需要关心底层用的是哪个 Provider。
														
 
															+
														
 
															+### Provider 选择
														
 
															+
														
 
															+`src/utils/model/providers.ts` 中的 `getAPIProvider()` 根据配置决定使用哪个 Provider：
														
 
															-| Provider | 特点 |
														
 
															-|----------|------|
														
 
															-| Anthropic Direct | 原生 SSE 流，延迟最低 |
														
 
															-| AWS Bedrock | 通过 AWS SDK 包装的流式接口 |
														
 
															-| Google Vertex | gRPC 流转换为事件流 |
														
 
															+```typescript
														
 
															+// 根据 api_provider 配置选择：
														
 
															+// "anthropic" → 直连
														
 
															+// "bedrock"   → AWS SDK
														
 
															+// "vertex"    → Google SDK
														
 
															+// 第三方 base URL → 自动检测
														
 
															+```
														
 
															-系统通过统一的事件抽象层屏蔽这些差异——上层代码不需要关心底层用的是哪个 Provider。
														
 
															+每个 Provider 需要适配的细节包括：认证方式、beta header、请求参数格式、错误码映射——但这些差异在 `claude.ts` 的 `queryStream()` 函数中被统一处理。
														
--- a/docs/extensibility/custom-agents.mdx
+++ b/docs/extensibility/custom-agents.mdx
@@ -1,56 +1,210 @@
 
															 ---
														
 
															 title: "自定义 Agent"
														
 
															-description: "定义你自己的 AI 角色——不同的人格、能力和边界"
														
 
															+description: "定义你自己的 AI 角色——从 Markdown 文件到运行时注入的完整链路"
														
 
															 ---
														
 
															-{/* 本章目标：解释自定义 Agent 定义的设计 */}
														
 
															+{/* 本章目标：揭示 Agent 定义的完整数据模型、加载发现机制、工具过滤和与 AgentTool 的联动 */}
														
 
															-## 为什么需要自定义 Agent
														
 
															+## Agent 定义的三种来源
														
 
															-默认的 Claude Code 是一个"全能型"助手。但有些场景需要更专门化的角色：
														
 
															+Claude Code 的 Agent 不仅仅来自用户自定义——系统有三类来源，按优先级合并：
														
 
															-- 一个只负责代码审查、不会修改代码的 Agent
														
 
															-- 一个专门处理 DevOps 任务的 Agent
														
 
															-- 一个面向初学者、回答更详细的 Agent
														
 
															+| 来源 | 位置 | 优先级 |
														
 
															+|------|------|--------|
														
 
															+| **Built-in** | `src/tools/AgentTool/built-in/` 硬编码 | 最低（可被覆盖） |
														
 
															+| **Plugin** | 通过插件系统注册 | 中 |
														
 
															+| **User/Project/Policy** | `.claude/agents/*.md` 或 settings.json | 最高 |
														
 
															-## Agent 定义
														
 
															+合并逻辑在 `getActiveAgentsFromList()` 中：按 `agentType` 去重，后者覆盖前者。这意味着你可以在 `.claude/agents/` 中放一个 `Explore.md` 来完全替换内置的 Explore Agent。
														
 
															-自定义 Agent 通过 Markdown 文件定义，放在 `.claude/agents/` 目录：
														
 
															+## Markdown Agent 文件的完整格式
														
 
															-| 配置项 | 说明 |
														
 
															-|--------|------|
														
 
															-| **名称** | Agent 的标识和显示名 |
														
 
															-| **描述** | 这个 Agent 的职责说明 |
														
 
															-| **System Prompt** | 自定义的角色指令——替换或追加到默认 System Prompt |
														
 
															-| **允许的工具** | 这个 Agent 可以使用哪些工具 |
														
 
															-| **模型** | 使用哪个 AI 模型 |
														
 
															+```markdown
														
 
															+---
														
 
															+# === 必需字段 ===
														
 
															+name: "reviewer"                    # Agent 标识（agentType）
														
 
															+description: "Code review specialist, read-only analysis"
														
 
															+
														
 
															+# === 工具控制 ===
														
 
															+tools: "Read,Glob,Grep,Bash"        # 允许的工具列表（逗号分隔）
														
 
															+disallowedTools: "Write,Edit"       # 显式禁止的工具
														
 
															+
														
 
															+# === 模型配置 ===
														
 
															+model: "haiku"                      # 指定模型（或 "inherit" 继承主线程）
														
 
															+effort: "high"                      # 推理努力程度：low/medium/high 或整数
														
 
															+
														
 
															+# === 行为控制 ===
														
 
															+maxTurns: 10                        # 最大 agentic 轮次
														
 
															+permissionMode: "plan"              # 权限模式：plan/bypassPermissions 等
														
 
															+background: true                    # 始终作为后台任务运行
														
 
															+initialPrompt: "/search TODO"       # 首轮用户消息前缀（支持斜杠命令）
														
 
															+
														
 
															+# === 隔离与持久化 ===
														
 
															+isolation: "worktree"               # 在独立 git worktree 中运行
														
 
															+memory: "project"                   # 持久记忆范围：user/project/local
														
 
															+
														
 
															+# === MCP 服务器 ===
														
 
															+mcpServers:
														
 
															+  - "slack"                         # 引用已配置的 MCP 服务器
														
 
															+  - database:                       # 内联定义
														
 
															+      command: "npx"
														
 
															+      args: ["mcp-db"]
														
 
															+
														
 
															+# === Hooks ===
														
 
															+hooks:
														
 
															+  PreToolUse:
														
 
															+    - command: "audit-log.sh"
														
 
															+      timeout: 5000
														
 
															+
														
 
															+# === Skills ===
														
 
															+skills: "code-review,security-review"  # 预加载的 skills（逗号分隔）
														
 
															+
														
 
															+# === 显示 ===
														
 
															+color: "blue"                       # 终端中的 Agent 颜色标识
														
 
															+---
														
 
															+
														
 
															+你是代码审查专家。你的职责是...
														
 
															+
														
 
															+（正文内容 = system prompt）
														
 
															+```
														
 
															+
														
 
															+### 字段解析细节
														
 
															+
														
 
															+- **`tools`**：通过 `parseAgentToolsFromFrontmatter()` 解析，支持逗号分隔字符串或数组
														
 
															+- **`model: "inherit"`**：使用主线程的模型（区分大小写，只有小写 "inherit" 有效）
														
 
															+- **`memory`**：启用后自动注入 `Write`/`Edit`/`Read` 工具（即使 `tools` 未包含），并在 system prompt 末尾追加 memory 指令
														
 
															+- **`isolation: "remote"`**：仅在 Anthropic 内部可用（`USER_TYPE === 'ant'`），外部构建只支持 `worktree`
														
 
															+- **`background`**：`true` 使 Agent 始终在后台运行，主线程不等待结果
														
 
															+
														
 
															+## 加载与发现机制
														
 
															+
														
 
															+`getAgentDefinitionsWithOverrides()`（被 `memoize` 缓存）执行完整的发现流程：
														
 
															+
														
 
															+```
														
 
															+1. 加载 Markdown 文件
														
 
															+   ├── loadMarkdownFilesForSubdir('agents', cwd)
														
 
															+   │   ├── ~/.claude/agents/*.md  （用户级，source = 'userSettings'）
														
 
															+   │   ├── .claude/agents/*.md    （项目级，source = 'projectSettings'）
														
 
															+   │   └── managed/policy sources （策略级，source = 'policySettings'）
														
 
															+   │
														
 
															+   └── 每个 .md 文件：
														
 
															+       ├── 解析 YAML frontmatter
														
 
															+       ├── 正文作为 system prompt
														
 
															+       ├── 校验必需字段（name, description）
														
 
															+       ├── 静默跳过无 frontmatter 的 .md 文件（可能是参考文档）
														
 
															+       └── 解析失败 → 记录到 failedFiles，不阻塞其他 Agent
														
 
															+
														
 
															+2. 并行加载 Plugin Agents
														
 
															+   └── loadPluginAgents() → memoized
														
 
															+
														
 
															+3. 初始化 Memory Snapshots（如果 AGENT_MEMORY_SNAPSHOT 启用）
														
 
															+   └── initializeAgentMemorySnapshots()
														
 
															+
														
 
															+4. 合并 Built-in + Plugin + Custom
														
 
															+   └── getActiveAgentsFromList() → 按 agentType 去重，后者覆盖前者
														
 
															+
														
 
															+5. 分配颜色
														
 
															+   └── setAgentColor(agentType, color) → 终端 UI 中区分不同 Agent
														
 
															+```
														
 
															+
														
 
															+## 工具过滤的实现
														
 
															+
														
 
															+当 Agent 被派生时，`AgentTool` 根据定义中的 `tools` / `disallowedTools` 过滤可用工具列表：
														
 
															+
														
 
															+```
														
 
															+全部工具
														
 
															+  ↓ disallowedTools 移除
														
 
															+  ↓ tools 白名单过滤（如果指定）
														
 
															+可用工具
														
 
															+```
														
 
															+
														
 
															+- **`tools` 未指定**：Agent 可以使用所有工具（默认全能）
														
 
															+- **`tools` 指定**：只能使用列出的工具
														
 
															+- **`disallowedTools`**：即使 `tools` 未指定，这些工具也被禁止
														
 
															+- **自动注入**：`memory` 启用时自动添加 `Write`/`Edit`/`Read`
														
 
															+
														
 
															+以内置 Explore Agent 为例：
														
 
															+
														
 
															+```typescript
														
 
															+// src/tools/AgentTool/built-in/exploreAgent.ts
														
 
															+disallowedTools: [
														
 
															+  'Agent',           // 不能嵌套调用 Agent
														
 
															+  'ExitPlanMode',    // 不需要 plan mode
														
 
															+  'FileEdit',        // 只读
														
 
															+  'FileWrite',       // 只读
														
 
															+  'NotebookEdit',    // 只读
														
 
															+]
														
 
															+```
														
 
															+
														
 
															+## System Prompt 的注入方式
														
 
															+
														
 
															+Agent 的 system prompt 通过 `getSystemPrompt()` 闭包延迟生成：
														
 
															+
														
 
															+```typescript
														
 
															+// Markdown Agent
														
 
															+getSystemPrompt: () => {
														
 
															+  if (isAutoMemoryEnabled() && memory) {
														
 
															+    return systemPrompt + '\n\n' + loadAgentMemoryPrompt(agentType, memory)
														
 
															+  }
														
 
															+  return systemPrompt
														
 
															+}
														
 
															+```
														
 
															+
														
 
															+这意味着：
														
 
															+1. **Markdown 正文 = 完整的 system prompt**——不是追加，而是替换默认 prompt
														
 
															+2. **Memory 指令**在 memory 启用时自动追加到末尾
														
 
															+3. **闭包延迟计算**——memory 状态可能在文件加载后才变化
														
 
															+
														
 
															+对于 Built-in Agent，`getSystemPrompt` 接受 `toolUseContext` 参数，可以根据运行时状态（如是否使用嵌入式搜索工具）动态调整 prompt 内容。
														
 
															+
														
 
															+## 与 AgentTool 的联动
														
 
															+
														
 
															+当主 Agent 需要派生子 Agent 时：
														
 
															-## 与子 Agent 的关系
														
 
															+```
														
 
															+AgentTool.call({ subagent_type: "reviewer", ... })
														
 
															+  ↓
														
 
															+1. 从 agentDefinitions.activeAgents 查找 agentType === "reviewer"
														
 
															+  ↓
														
 
															+2. 检查 requiredMcpServers（如果 Agent 要求特定 MCP 服务器）
														
 
															+  ↓
														
 
															+3. 过滤工具列表（tools / disallowedTools）
														
 
															+  ↓
														
 
															+4. 解析模型：
														
 
															+   - "inherit" → 使用主线程模型
														
 
															+   - 具体模型名 → 直接使用
														
 
															+   - 未指定 → 主线程模型
														
 
															+  ↓
														
 
															+5. 解析权限模式（permissionMode）
														
 
															+  ↓
														
 
															+6. 构建隔离环境（如果 isolation === "worktree"）
														
 
															+  ↓
														
 
															+7. 注入 system prompt（getSystemPrompt()）
														
 
															+  ↓
														
 
															+8. 注入 initialPrompt（如果定义了）
														
 
															+  ↓
														
 
															+9. 启动子 Agent 循环（forkSubagent / runAgent）
														
 
															+```
														
 
															-自定义 Agent 可以作为子 Agent 被启动：
														
 
															+## 内置 Agent 参考
														
 
															-- 主 Agent 说"这个任务需要安全审查"
														
 
															-- 系统启动一个自定义的"安全审查 Agent"
														
 
															-- 该 Agent 只有阅读权限，使用专门的安全审查 Prompt
														
 
															+| Agent | agentType | 角色 | 工具限制 | 模型 |
														
 
															+|-------|-----------|------|---------|------|
														
 
															+| **General Purpose** | `general-purpose` | 默认子 Agent | 全部工具 | 主线程模型 |
														
 
															+| **Explore** | `Explore` | 代码搜索专家 | 只读（无 Write/Edit） | haiku（外部） |
														
 
															+| **Plan** | `Plan` | 规划专家 | 只读 + ExitPlanMode | inherit |
														
 
															+| **Verification** | `verification` | 结果验证 | 由 feature flag 控制 | — |
														
 
															+| **Code Guide** | `claude-code-guide` | Claude Code 使用指南 | 只读 | — |
														
 
															+| **Statusline Setup** | `statusline-setup` | 终端状态栏配置 | 有限 | — |
														
 
															-这实现了**角色分离**——不同的任务由不同"人格"的 Agent 处理。
														
 
															+SDK 入口（`sdk-ts`/`sdk-py`/`sdk-cli`）不加载 Code Guide Agent。环境变量 `CLAUDE_AGENT_SDK_DISABLE_BUILTIN_AGENTS` 可以完全禁用内置 Agent，给 SDK 用户提供空白画布。
														
 
															-## 复用与共享
														
 
															+## Agent Memory：持久化的 Agent 状态
														
 
															-<CardGroup cols={2}>
														
 
															-  <Card title="项目级" icon="folder">
														
 
															-    放在项目的 `.claude/agents/` 目录，团队所有人可用
														
 
															-  </Card>
														
 
															-  <Card title="用户级" icon="user">
														
 
															-    放在 `~/.claude/agents/` 目录，跨项目可用
														
 
															-  </Card>
														
 
															-</CardGroup>
														
 
															+当 `memory` 字段启用时，Agent 获得跨会话的持久记忆：
														
 
															-## 实际应用
														
 
															+- **`local`**：当前项目、当前用户有效
														
 
															+- **`project`**：当前项目所有用户共享
														
 
															+- **`user`**：所有项目共享
														
 
															-| Agent | 角色 | 工具限制 |
														
 
															-|-------|------|---------|
														
 
															-| `reviewer` | 代码审查员 | 只允许 Read、Glob、Grep |
														
 
															-| `devops` | DevOps 工程师 | 允许 Bash，限制在 infra/ 目录 |
														
 
															-| `tutor` | 编程导师 | 全部工具，但 Prompt 强调教学 |
														
 
															-| `security` | 安全审计员 | 只允许搜索和阅读，输出安全报告 |
														
 
															+Memory 通过 `loadAgentMemoryPrompt()` 注入到 system prompt 末尾，包含读写记忆的指令。Agent Memory Snapshot 机制在项目间同步 `user` 级记忆。
														
--- a/docs/introduction/what-is-claude-code.mdx
+++ b/docs/introduction/what-is-claude-code.mdx
@@ -1,39 +1,109 @@
 
															 ---
														
 
															 title: "什么是 Claude Code"
														
 
															-description: "一个住在终端里的 AI 编程搭档"
														
 
															+description: "terminal-native agentic system —— 不是 IDE 插件，不是 Web Chat"
														
 
															 ---
														
 
															-{/* 本章目标：让完全不了解 Claude Code 的读者在 3 分钟内建立直觉 */}
														
 
															-
														
 
															 ## 一句话定义
														
 
															-Claude Code 是一个运行在命令行终端里的 AI 编程助手。你用自然语言描述需求，它直接帮你读代码、改文件、跑命令、搜索项目——全部在你的本地环境中完成。
														
 
															+Claude Code 是一个**运行在本地终端中的 agentic coding system**。它不是给建议的聊天机器人——它直接在你的项目目录中读代码、改文件、跑命令、调试程序，拥有完整的 shell 能力。
														
 
															+
														
 
															+## 技术定位：terminal-native agentic system
														
 
															+
														
 
															+理解 Claude Code 的关键在于三个词：
														
 
															+
														
 
															+| 定位关键词 | 含义 |
														
 
															+|-----------|------|
														
 
															+| **Terminal-native** | 原生 CLI 应用，不是 IDE 插件、不是 Web 界面、不是 API wrapper |
														
 
															+| **Agentic** | AI 自主决策工具调用链，不是"一问一答"的聊天模式 |
														
 
															+| **Coding system** | 面向软件工程全流程，不是通用问答工具 |
														
 
															+
														
 
															+与同类工具的**架构层面**差异（不是功能清单）：
														
 
															+
														
 
															+| 工具 | 架构模式 | 运行位置 | 工具执行 |
														
 
															+|------|----------|----------|----------|
														
 
															+| **Claude Code** | Terminal-native agentic loop | 本地进程 | 直接 shell 执行 |
														
 
															+| Cursor / Copilot | IDE-integrated autocomplete + chat | IDE 进程内 | LSP / IDE API |
														
 
															+| Aider | CLI chat → git patch | 本地进程 | 文件操作为主 |
														
 
															+| ChatGPT / Claude.ai | Cloud chat + artifacts | 浏览器/云端 | 沙箱容器 |
														
 
															+
														
 
															+核心差异：Claude Code 拥有**完整的 shell 访问权**——这意味着它可以做任何你在终端里能做的事，但也需要对应的安全机制来约束这个能力。
														
 
															+
														
 
															+## 端到端示例：从输入到输出
														
 
															+
														
 
															+当你在终端中输入 `bun run dev 有个 TypeScript 报错，帮我修一下` 时，系统发生了什么？
														
 
															+
														
 
															+```
														
 
															+┌─────────────────────────────────────────────────────────┐
														
 
															+│ 1. 入口层 (cli.tsx → main.tsx)                          │
														
 
															+│    feature() = false, MACRO 注入, 启动 Commander.js CLI  │
														
 
															+├─────────────────────────────────────────────────────────┤
														
 
															+│ 2. 交互层 (REPL.tsx — React/Ink)                        │
														
 
															+│    PromptInput 捕获用户输入 → UserMessage 加入会话       │
														
 
															+├─────────────────────────────────────────────────────────┤
														
 
															+│ 3. 编排层 (QueryEngine.ts)                               │
														
 
															+│    管理 turn 生命周期、token 预算、compaction 触发       │
														
 
															+├─────────────────────────────────────────────────────────┤
														
 
															+│ 4. 核心循环 (query.ts — Agentic Loop)                    │
														
 
															+│    组装上下文 → 调 API → 收流式响应 → 解析工具调用      │
														
 
															+│    → 权限检查 → 执行工具 → 结果回传 → 再次调 API → 循环 │
														
 
															+├─────────────────────────────────────────────────────────┤
														
 
															+│ 5. 工具执行 (BashTool.call / FileEditTool.call / ...)    │
														
 
															+│    实际执行: 读文件、运行命令、搜索代码...               │
														
 
															+├─────────────────────────────────────────────────────────┤
														
 
															+│ 6. 通信层 (claude.ts → Anthropic API)                    │
														
 
															+│    流式 HTTP, 支持 Bedrock/Vertex/Azure 多 provider      │
														
 
															+└─────────────────────────────────────────────────────────┘
														
 
															+```
														
 
															+
														
 
															+具体到这个报错修复场景，一次典型的 agentic loop 可能包含多轮工具调用：
														
 
															+
														
 
															+| Turn | AI 决策 | 工具调用 | 结果 |
														
 
															+|------|---------|----------|------|
														
 
															+| 1 | 先看报错信息 | `Bash("bun run dev 2>&1 | head -30")` | TypeScript 错误输出 |
														
 
															+| 2 | 定位到文件 | `Read("src/utils/foo.ts")` | 源代码内容 |
														
 
															+| 3 | 搜索相关类型定义 | `Grep("interface Foo", "src/")` | 类型定义位置 |
														
 
															+| 4 | 修复代码 | `FileEdit(old, new)` | 代码已修改 |
														
 
															+| 5 | 验证修复 | `Bash("bun run dev 2>&1 | head -10")` | 编译通过 |
														
 
															+
														
 
															+每一步都是 AI 自主决策的——它决定用哪个工具、传什么参数、何时停止。这就是 "agentic" 的含义。
														
 
															+
														
 
															+## 它不是什么
														
 
															+
														
 
															+- **不是 IDE 插件**：没有图形界面，不依赖 VS Code 或任何 IDE
														
 
															+- **不是 API wrapper**：它有自己的工具系统、权限模型、上下文工程、会话管理
														
 
															+- **不是聊天机器人**：输出不是纯文本，而是实际的文件修改、命令执行
														
 
															+- **不是无脑执行器**：每个敏感操作都有权限检查和用户确认环节
														
 
															+
														
 
															+## 启动入口解剖
														
 
															+
														
 
															+真正的代码入口是 `src/entrypoints/cli.tsx`，它做了三件关键的事：
														
 
															+
														
 
															+```typescript
														
 
															+// 1. 注入运行时 polyfill —— feature() 永远返回 false
														
 
															+const feature = (_name: string) => false;
														
 
															-## 它能做什么
														
 
															+// 2. 注入构建时宏
														
 
															+globalThis.MACRO = { VERSION: "2.1.888", BUILD_TIME: ..., };
														
 
															-- **对话式编程**：像和同事聊天一样描述需求，AI 直接动手实现
														
 
															-- **理解整个项目**：自动读取项目结构、git 历史、配置文件，建立项目全景认知
														
 
															-- **操作你的电脑**：读写文件、执行 shell 命令、搜索代码——不只是给建议，而是真正动手
														
 
															-- **保护你的安全**：每个敏感操作都需要你确认，有沙箱、有权限管控
														
 
															+// 3. 声明构建目标
														
 
															+globalThis.BUILD_TARGET = "external";  // 外部构建（非 Anthropic 内部）
														
 
															+globalThis.BUILD_ENV = "production";
														
 
															+globalThis.INTERFACE_TYPE = "stdio";   // 标准 I/O 交互
														
 
															+```
														
 
															-## 它和 ChatGPT / 普通聊天机器人的区别
														
 
															+然后控制流传递到 `src/main.tsx`：
														
 
															+1. Commander.js 解析命令行参数
														
 
															+2. 初始化认证、遥测、策略限制
														
 
															+3. 加载工具列表（`getTools()`）
														
 
															+4. 启动 REPL（`launchRepl()`）或管道模式（`-p`）
														
 
															-| | 普通聊天 AI | Claude Code |
														
 
															-|---|---|---|
														
 
															-| 运行环境 | 云端网页 | 你的本地终端 |
														
 
															-| 能做什么 | 回答问题、生成文本 | 直接操作你的项目文件和命令行 |
														
 
															-| 项目理解 | 你需要手动粘贴代码 | 自动读取整个项目上下文 |
														
 
															-| 安全性 | 无需考虑 | 多层权限保护 |
														
 
															+## 为什么选择终端
														
 
															-## 一次典型的交互流程
														
 
															+终端不是限制，而是选择。它带来了独特的能力：
														
 
															-<Frame>
														
 
															-  <img src="/docs/images/interaction-flow.png" alt="Claude Code 典型交互流程" />
														
 
															-</Frame>
														
 
															+- **完整的 shell 访问**：可以运行任何命令行工具，无需为每个能力写插件
														
 
															+- **项目原生**：直接在项目目录工作，理解文件系统结构、git 状态
														
 
															+- **可组合性**：管道模式（`echo "..." | claude -p`）允许嵌入 CI/CD 和自动化流程
														
 
															+- **低延迟**：没有 Electron 开销，React/Ink 渲染的 TUI 响应极快
														
 
															-1. 你在终端输入自然语言需求
														
 
															-2. Claude Code 分析你的项目上下文
														
 
															-3. 它决定使用哪些工具（读文件？执行命令？）
														
 
															-4. 每个操作请求你确认（或根据规则自动放行）
														
 
															-5. 执行完成后，把结果反馈给 AI，AI 决定下一步
														
 
															-6. 循环，直到任务完成
														
 
															+代价是用户需要适应命令行界面——但也正因如此，它吸引的是需要**真正掌控开发环境**的开发者。
														
--- a/docs/introduction/why-this-whitepaper.mdx
+++ b/docs/introduction/why-this-whitepaper.mdx
@@ -1,40 +1,120 @@
 
															 ---
														
 
															 title: "为什么写这份白皮书"
														
 
															-description: "将 LLM 能力落地到真实工作流的工程范本"
														
 
															+description: "对 Anthropic 官方 CLI 的逆向工程分析——不是官方文档"
														
 
															 ---
														
 
															-{/* 本章目标：解释为什么这个项目的架构值得深入研究 */}
														
 
															+## 这份白皮书是什么
														
 
															-## 不只是一个聊天工具
														
 
															+这是对 Anthropic 官方发布的 **Claude Code CLI** 的**逆向工程分析**。
														
 
															-Claude Code 解决的核心问题是：**如何让大语言模型从"能说会道"变成"能说会做"**。
														
 
															+源码经过反编译处理（TypeScript 单文件 bundle 逆向），保留了核心功能模块，但包含大量 `unknown`/`never`/`{}` 类型错误——这些不影响 Bun 运行时执行，但意味着我们的分析基于运行时行为 + 残留源码结构，而非原始源码。
														
 
															-这不是简单地给 AI 套一个 shell。它涉及一系列精巧的工程决策：
														
 
															+**这不是：**
														
 
															+- 官方文档或使用教程
														
 
															+- API 参考手册
														
 
															+- Claude Code 的功能推销
														
 
															-- AI 说"我要编辑这个文件"时，如何确保安全？
														
 
															-- 对话越来越长，token 快爆了怎么办？
														
 
															-- AI 需要并行处理多个子任务时，如何隔离和协调？
														
 
															-- 用户想扩展 AI 的能力（接数据库、连 API），如何设计插拔机制？
														
 
															+**这是：**
														
 
															+- 一个生产级 agentic system 的架构解构
														
 
															+- 每个设计决策背后的"为什么"
														
 
															+- 可复用的工程模式：agentic loop、工具抽象、上下文工程、安全纵深防御
														
 
															-## 这份白皮书关注什么
														
 
															+## 逆向过程中最精妙的设计决策
														
 
															-<CardGroup cols={2}>
														
 
															-  <Card title="功能视角" icon="eye">
														
 
															-    不堆代码，从"用户能做什么、AI 如何决策"出发
														
 
															-  </Card>
														
 
															-  <Card title="设计决策" icon="lightbulb">
														
 
															-    每个功能背后的"为什么这样设计"
														
 
															-  </Card>
														
 
															-  <Card title="架构模式" icon="sitemap">
														
 
															-    可复用的模式：Agentic Loop、工具抽象、上下文工程
														
 
															-  </Card>
														
 
															-  <Card title="安全哲学" icon="shield">
														
 
															-    AI 操作真实环境时的信任与控制平衡
														
 
															-  </Card>
														
 
															-</CardGroup>
														
 
															+### 1. Agentic Loop 的自愈能力
														
 
															+
														
 
															+`src/query.ts` 实现的核心循环不是简单的"发请求→收响应"。它是一个**自愈的状态机**：
														
 
															+
														
 
															+- API 返回错误（限流、token 超限）→ 自动重试/降级
														
 
															+- 工具执行超时 → 后台化 + 通知机制
														
 
															+- 对话过长触发 compaction → 压缩历史后无缝继续
														
 
															+- 用户中断 → 生成 `UserInterruptionMessage` 让 AI 理解发生了什么
														
 
															+
														
 
															+这不是"if-else 堆叠"，而是让 AI 自己根据上下文决定下一步——即使发生了意外。
														
 
															+
														
 
															+### 2. 上下文工程的分层策略
														
 
															+
														
 
															+AI 没有真正的"记忆"，Claude Code 通过精心分层营造了这个幻觉：
														
 
															+
														
 
															+| 层 | 机制 | 持久性 |
														
 
															+|----|------|--------|
														
 
															+| **System Prompt** | 项目结构、git 状态、CLAUDE.md | 每轮重建 |
														
 
															+| **对话历史** | 完整的 User/Assistant/Tool 消息 | 会话内 |
														
 
															+| **Compaction** | 自动压缩过长对话为摘要 | 压缩后替代原始消息 |
														
 
															+| **Memory 文件** | 跨会话持久化的笔记 | 永久（用户可控） |
														
 
															+| **File History** | 文件修改时间戳快照 | 会话内 |
														
 
															+
														
 
															+`src/context.ts` 组装 System Prompt 时的策略是：**不变内容在前、变化内容在后**——这利用了 API 的缓存机制，前缀不变时可以复用缓存 token。
														
 
															+
														
 
															+### 3. 工具系统的权限双轨制
														
 
															+
														
 
															+`src/tools/BashTool/shouldUseSandbox.ts` 展示了一个精巧的双重安全模型：
														
 
															+
														
 
															+- **应用层**：权限规则决定"能不能执行"（白名单/黑名单/用户确认）
														
 
															+- **OS 层**：沙箱决定"执行时能做什么"（文件系统/网络/进程隔离）
														
 
															+
														
 
															+两层的信任假设不同：应用层信任用户配置，OS 层不信任任何东西。即使 AI 绕过了应用层权限（理论上不可能，但纵深防御），OS 层沙箱仍然限制实际危害。
														
 
															+
														
 
															+### 4. Feature Flag 的全局开关
														
 
															+
														
 
															+`src/entrypoints/cli.tsx` 中一行代码决定了整个系统的行为：
														
 
															+
														
 
															+```typescript
														
 
															+const feature = (_name: string) => false;
														
 
															+```
														
 
															+
														
 
															+所有 `feature('FLAG_NAME')` 调用返回 `false`——这意味着 Anthropic 内部的实验功能（COORDINATOR_MODE、KAIROS、PROACTIVE 等）全部禁用。在官方构建中，这些 flag 通过 Bun 的 `bun:bundle` 在编译时注入，不同用户群体看到不同功能。
														
 
															+
														
 
															+这是一个**渐进式发布架构**：同一个代码库，通过 feature flag 控制功能可见性，而不需要维护多个分支。
														
 
															+
														
 
															+### 5. Compaction 的分档策略
														
 
															+
														
 
															+`src/services/compact/` 实现了三种压缩策略：
														
 
															+
														
 
															+- **Micro-compact**：单次工具输出过长时，截断结果
														
 
															+- **Auto-compact**：对话 token 接近上限时，自动压缩历史
														
 
															+- **Reactive-compact**：API 返回 token 超限错误时，紧急压缩后重试
														
 
															+
														
 
															+这不是简单的"砍掉旧消息"——而是用 AI 自身来总结之前的对话，保留语义信息。压缩后插入一条 `TombstoneMessage` 标记边界。
														
 
															+
														
 
															+## 阅读路线图
														
 
															+
														
 
															+推荐的阅读顺序，每章解决一个核心问题：
														
 
															+
														
 
															+```
														
 
															+什么是 Claude Code (你在读的)          ← 建立直觉
														
 
															+    │
														
 
															+    ├── 架构全景                       ← 五层架构 + 数据流
														
 
															+    │
														
 
															+    ├── 安全体系                       ← 信任与控制
														
 
															+    │   ├── 权限模型                   ← 应用层安全
														
 
															+    │   ├── 沙箱机制                   ← OS 层安全
														
 
															+    │   └── Plan Mode                  ← 用户主导模式
														
 
															+    │
														
 
															+    ├── 对话引擎                       ← AI 如何思考
														
 
															+    │   ├── Agentic Loop               ← 核心循环
														
 
															+    │   ├── 流式响应                   ← 实时通信
														
 
															+    │   └── 多轮对话                   ← 上下文管理
														
 
															+    │
														
 
															+    ├── 上下文工程                     ← 记忆与预算
														
 
															+    │   ├── System Prompt              ← 上下文组装
														
 
															+    │   ├── Token 预算                 ← 预算管理
														
 
															+    │   └── 项目记忆                   ← 跨会话持久化
														
 
															+    │
														
 
															+    ├── 工具系统                       ← AI 的双手
														
 
															+    │   ├── 工具概览                   ← 统一接口
														
 
															+    │   ├── Shell 执行                 ← Bash 工具
														
 
															+    │   └── 搜索与导航                 ← Glob/Grep
														
 
															+    │
														
 
															+    └── Agent 与扩展                   ← 能力扩展
														
 
															+        ├── 子 Agent                   ← 并行任务
														
 
															+        ├── 自定义 Agent               ← 用户定义
														
 
															+        └── MCP 协议                   ← 外部工具接入
														
 
															+```
														
 
															 ## 适合谁读
														
 
															-- 想理解 AI Agent 产品架构的开发者
														
 
															-- 正在构建类似工具的团队
														
 
															-- 对 LLM 应用工程化感兴趣的任何人
														
 
															+- **AI Agent 开发者**：想理解生产级 agentic system 的架构模式
														
 
															+- **安全工程师**：对 AI 操作真实环境时的信任模型感兴趣
														
 
															+- **工具构建者**：正在构建类似的 coding assistant 或 CLI 工具
														
 
															+- **好奇心驱动的开发者**：想知道"AI 编程助手到底怎么工作的"
														
--- a/docs/safety/sandbox.mdx
+++ b/docs/safety/sandbox.mdx
@@ -3,33 +3,212 @@ title: "沙箱机制"
 
															 description: "即使命令被允许执行，也不意味着它可以为所欲为"
														
 
															 ---
														
 
															-{/* 本章目标：解释沙箱的作用和原理 */}
														
 
															-
														
 
															 ## 权限之外的第二道防线
														
 
															 权限系统决定"这条命令能不能执行"，沙箱决定"执行时能做到什么程度"。
														
 
															-即使一条命令通过了权限审批，沙箱仍然可以限制它的行为：
														
 
															+即使一条命令通过了权限审批，沙箱仍然可以限制它的行为。两者构成纵深防御的两层：
														
 
															+- **权限层**（应用级）：在工具调用前检查，决定是否弹窗审批
														
 
															+- **沙箱层**（OS 级）：在进程级别强制约束，即使 AI 生成了恶意命令也无法突破
														
 
															+
														
 
															+## 执行链路：从用户输入到沙箱包裹
														
 
															+
														
 
															+一条 Bash 命令的完整执行路径如下：
														
 
															+
														
 
															+```
														
 
															+用户输入 → BashTool.call()
														
 
															+         → shouldUseSandbox(input) ─── 是否需要沙箱？
														
 
															+         → Shell.exec(command, { shouldUseSandbox })
														
 
															+         → SandboxManager.wrapWithSandbox(command)
														
 
															+         → spawn(wrapped_command)  ─── 实际进程创建
														
 
															+```
														
 
															+
														
 
															+关键判定发生在 `shouldUseSandbox()`（`src/tools/BashTool/shouldUseSandbox.ts`），它执行以下检查：
														
 
															+
														
 
															+1. **全局开关**：`SandboxManager.isSandboxingEnabled()` — 检查平台支持 + 依赖完整性 + 用户设置
														
 
															+2. **显式跳过**：如果 `dangerouslyDisableSandbox: true` 且策略允许（`allowUnsandboxedCommands`），则不走沙箱
														
 
															+3. **排除列表**：用户可在 `settings.json` 中配置 `sandbox.excludedCommands`，匹配的命令跳过沙箱
														
 
															+4. **默认行为**：以上条件都不满足时，**进入沙箱**
														
 
															+
														
 
															+## `shouldUseSandbox()` 判定逻辑详解
														
 
															+
														
 
															+```typescript
														
 
															+// src/tools/BashTool/shouldUseSandbox.ts
														
 
															+function shouldUseSandbox(input: Partial<SandboxInput>): boolean {
														
 
															+  // 1. 全局未启用 → 直接跳过
														
 
															+  if (!SandboxManager.isSandboxingEnabled()) return false
														
 
															+
														
 
															+  // 2. 显式禁用 + 策略允许 → 跳过
														
 
															+  if (input.dangerouslyDisableSandbox && 
														
 
															+      SandboxManager.areUnsandboxedCommandsAllowed()) return false
														
 
															+
														
 
															+  // 3. 无命令 → 跳过
														
 
															+  if (!input.command) return false
														
 
															+
														
 
															+  // 4. 匹配排除列表 → 跳过
														
 
															+  if (containsExcludedCommand(input.command)) return false
														
 
															+
														
 
															+  // 5. 其他情况 → 必须沙箱化
														
 
															+  return true
														
 
															+}
														
 
															+```
														
 
															+
														
 
															+`containsExcludedCommand()` 的匹配机制值得注意——它不只是简单的前缀匹配，而是支持三种模式：
														
 
															+
														
 
															+| 模式 | 示例 | 匹配行为 |
														
 
															+|------|------|----------|
														
 
															+| **精确匹配** | `npm run lint` | 完全相等 |
														
 
															+| **前缀匹配** | `npm run test:*` | 前缀 + 空格或完全相等 |
														
 
															+| **通配符** | `docker*` | 使用 `matchWildcardPattern` |
														
 
															+
														
 
															+对于复合命令（如 `docker ps && curl evil.com`），系统会先拆分为子命令，逐一检查。还会迭代剥离环境变量前缀（`FOO=bar bazel ...`）和包装命令（`timeout 30 bazel ...`），直到不动点——防止通过嵌套包装绕过。
														
 
															+
														
 
															+## 沙箱的配置模型
														
 
															+
														
 
															+沙箱配置来自 `settings.json` 中的 `sandbox` 字段（`src/entrypoints/sandboxTypes.ts`）：
														
 
															+
														
 
															+```jsonc
														
 
															+{
														
 
															+  "sandbox": {
														
 
															+    "enabled": true,                     // 主开关
														
 
															+    "autoAllowBashIfSandboxed": true,     // 沙箱中的命令自动允许（跳过审批）
														
 
															+    "allowUnsandboxedCommands": true,     // 是否允许 dangerouslyDisableSandbox
														
 
															+    "failIfUnavailable": false,           // 沙箱依赖缺失时是否报错退出
														
 
															+    
														
 
															+    "network": {
														
 
															+      "allowedDomains": ["github.com"],   // 网络白名单
														
 
															+      "deniedDomains": [],                // 网络黑名单
														
 
															+      "allowLocalBinding": true,          // 允许 localhost 绑定
														
 
															+      "httpProxyPort": 8888               // HTTP 代理端口（MITM）
														
 
															+    },
														
 
															+    
														
 
															+    "filesystem": {
														
 
															+      "allowWrite": ["~/projects"],       // 额外可写路径
														
 
															+      "denyWrite": ["~/.ssh"],            // 禁止写入路径
														
 
															+      "denyRead": [],                     // 禁止读取路径
														
 
															+      "allowRead": []                     // 在 denyRead 中重新放行
														
 
															+    },
														
 
															+    
														
 
															+    "excludedCommands": ["docker", "npm:*"]  // 不走沙箱的命令
														
 
															+  }
														
 
															+}
														
 
															+```
														
 
															+
														
 
															+`SandboxSettingsSchema` 定义了完整的 Zod 验证规则，包含一些未公开的设置如 `enabledPlatforms`（限制沙箱只在特定平台生效）。
														
 
															+
														
 
															+## 平台实现差异
														
 
															+
														
 
															+### macOS：sandbox-exec（Seatbelt）
														
 
															+
														
 
															+macOS 使用 Apple 的 Seatbelt 沙箱（`sandbox-exec` 命令），这是 macOS 原生的进程隔离机制。
														
 
															+
														
 
															+执行流程：
														
 
															+1. `SandboxManager.wrapWithSandbox()` 调用 `@anthropic-ai/sandbox-runtime` 的 `BaseSandboxManager`
														
 
															+2. 运行时生成 Seatbelt profile（基于配置中的网络/文件系统规则）
														
 
															+3. 通过 `sandbox-exec -p <profile> -- <command>` 包裹原始命令
														
 
															+4. Seatbelt 在内核级别强制执行约束
														
 
															+
														
 
															+网络隔离的实现方式：
														
 
															+- 通过代理端口拦截 HTTP/HTTPS 请求
														
 
															+- 域名白名单/黑名单在代理层过滤
														
 
															+- Unix socket 可单独配置允许路径
														
 
															+
														
 
															+### Linux：bubblewrap（bwrap）+ seccomp
														
 
															+
														
 
															+Linux 使用 `bubblewrap`（bwrap）创建命名空间隔离，配合 seccomp 过滤系统调用：
														
 
															+
														
 
															+依赖项（`apt install`）：
														
 
															+| 包 | 作用 |
														
 
															+|----|------|
														
 
															+| `bubblewrap` | 创建 mount/PID/network 命名空间 |
														
 
															+| `socat` | 网络代理（HTTP/SOCKS） |
														
 
															+| `libseccomp` / seccomp filter | 过滤 Unix socket 系统调用 |
														
 
															+
														
 
															+bwrap 的实现差异：
														
 
															+- **不支持 glob 路径模式**（macOS 的 Seatbelt 支持）— Linux 上带 glob 的权限规则会触发警告
														
 
															+- 执行后会在当前目录留下 0 字节的 mount-point 文件（如 `.bashrc`），需要 `cleanupAfterCommand()` 清理
														
 
															+- seccomp 无法按路径过滤 Unix socket（只能全允许或全拒绝），与 macOS 的按路径放行形成差异
														
 
															+
														
 
															+### 平台支持矩阵
														
 
															+
														
 
															+| 特性 | macOS | Linux | WSL |
														
 
															+|------|-------|-------|-----|
														
 
															+| 沙箱引擎 | sandbox-exec (Seatbelt) | bubblewrap + seccomp | 仅 WSL2 |
														
 
															+| 文件 glob | ✅ 完整支持 | ⚠️ 仅 `/**` 后缀 | 同 Linux |
														
 
															+| 网络 Unix socket 按路径 | ✅ | ❌ | ❌ |
														
 
															+| 依赖检查 | ripgrep | bwrap + socat + ripgrep + seccomp | 同 Linux |
														
 
															+
														
 
															+## 沙箱初始化流程
														
 
															+
														
 
															+```
														
 
															+REPL/SDK 启动
														
 
															+  → main.tsx → init.ts
														
 
															+  → SandboxManager.initialize(sandboxAskCallback)
														
 
															+    → detectWorktreeMainRepoPath()     // 检测 git worktree，放行主仓库 .git
														
 
															+    → convertToSandboxRuntimeConfig()  // 构建 SandboxRuntimeConfig
														
 
															+    → BaseSandboxManager.initialize()  // 启动底层运行时
														
 
															+    → settingsChangeDetector.subscribe() // 订阅设置变更，动态更新配置
														
 
															+```
														
 
															+
														
 
															+`convertToSandboxRuntimeConfig()`（`src/utils/sandbox/sandbox-adapter.ts`）完成从用户设置到运行时配置的转换：
														
 
															+
														
 
															+1. **网络规则**：从 `WebFetch(domain:...)` 权限规则提取域名 → `allowedDomains`
														
 
															+2. **文件系统规则**：从 `Edit(...)` / `Read(...)` 权限规则提取路径 → `allowWrite` / `denyWrite` / `denyRead`
														
 
															+3. **安全加固**：
														
 
															+   - 自动将项目目录加入 `allowWrite`
														
 
															+   - 自动将 `settings.json` 路径加入 `denyWrite`（防止沙箱逃逸）
														
 
															+   - 自动将 `.claude/skills` 加入 `denyWrite`（防止技能注入）
														
 
															+   - 检测 bare git repo 攻击向量，对 `HEAD`/`objects`/`refs` 做保护
														
 
															+
														
 
															+## `dangerouslyDisableSandbox` 的设计权衡
														
 
															+
														
 
															+这个参数的命名本身就传达了设计意图——它不是"关闭沙箱"，而是"**危险地禁用沙箱**"。
														
 
															+
														
 
															+双重保险机制：
														
 
															+1. **调用侧**：模型在 BashTool 的 `inputSchema` 中可以设置 `dangerouslyDisableSandbox: true`
														
 
															+2. **策略侧**：管理员可通过 `allowUnsandboxedCommands: false` 完全禁止此参数（企业部署场景）
														
 
															+
														
 
															+```typescript
														
 
															+// 即使 AI 请求了 dangerouslyDisableSandbox，策略层仍可覆盖
														
 
															+if (input.dangerouslyDisableSandbox && 
														
 
															+    SandboxManager.areUnsandboxedCommandsAllowed()) {
														
 
															+  return false  // 只有策略允许时才真正跳过沙箱
														
 
															+}
														
 
															+```
														
 
															-| 限制维度 | 说明 |
														
 
															-|----------|------|
														
 
															-| **文件系统** | 只能访问项目目录及其子目录 |
														
 
															-| **网络** | 可以禁止或限制网络访问 |
														
 
															-| **进程** | 限制可启动的子进程 |
														
 
															-| **时间** | 超时自动终止 |
														
 
															+`autoAllowBashIfSandboxed` 进一步补充了这个模型：当启用时，**在沙箱中的命令自动获得执行许可**，无需逐条审批。这基于一个信任假设——如果 OS 级沙箱已经限制了命令的能力，那么应用层的逐条审批就变得多余。
														
 
															-## 何时启用沙箱
														
 
															+## 沙箱违规处理
														
 
															-沙箱不是默认对所有命令生效——它根据风险评估动态决定：
														
 
															+当命令尝试违反沙箱约束时：
														
 
															-- 用户显式请求禁用沙箱的命令（`dangerouslyDisableSandbox`）不走沙箱
														
 
															-- 已通过安全规则白名单的命令可以跳过沙箱
														
 
															-- 未知命令或高风险命令强制进入沙箱
														
 
															+1. 运行时捕获违规事件（文件/网络访问被拒绝）
														
 
															+2. `SandboxManager.annotateStderrWithSandboxFailures()` 在输出中注入 `<sandbox_violations>` 标签
														
 
															+3. UI 层通过 `removeSandboxViolationTags()` 清理显示
														
 
															+4. 违规事件通过 `SandboxViolationStore` 持久化，可用于审计
														
 
															-## 沙箱的实现思路
														
 
															+## 完整执行链路示例
														
 
															-不同平台使用不同的沙箱技术：
														
 
															+以 `npm install` 为例：
														
 
															-- **macOS**：利用系统级沙箱机制限制文件和网络访问
														
 
															-- **Linux**：基于命名空间和 cgroup 的进程隔离
														
 
															-- 沙箱策略由系统自动选择，用户不需要手动配置
														
 
															+```
														
 
															+1. 用户在 REPL 中输入 → Claude 决定调用 BashTool
														
 
															+2. BashTool.validateInput() → 通过
														
 
															+3. BashTool.checkPermissions() → 检查权限规则
														
 
															+   ├── autoAllowBashIfSandboxed = true 且沙箱可用 → 自动允许
														
 
															+   └── 否则 → 弹窗请用户确认
														
 
															+4. BashTool.call() → runShellCommand()
														
 
															+5. shouldUseSandbox({ command: "npm install" })
														
 
															+   ├── SandboxManager.isSandboxingEnabled() → true
														
 
															+   ├── dangerouslyDisableSandbox → undefined
														
 
															+   └── containsExcludedCommand() → false（除非用户配置了排除 npm）
														
 
															+   → 结果: true，需要沙箱
														
 
															+6. Shell.exec() → SandboxManager.wrapWithSandbox("npm install")
														
 
															+   ├── macOS: sandbox-exec -p <generated-profile> -- bash -c 'npm install'
														
 
															+   └── Linux: bwrap ... bash -c 'npm install'
														
 
															+7. spawn(wrapped_command) → 子进程在沙箱内执行
														
 
															+8. 执行完成 → SandboxManager.cleanupAfterCommand()
														
 
															+   ├── 清理 bwrap 残留文件（Linux）
														
 
															+   └── scrubBareGitRepoFiles()（安全清理）
														
 
															+9. 结果返回给 Claude → 展示给用户
														
 
															+```
														
--- a/docs/safety/why-safety-matters.mdx
+++ b/docs/safety/why-safety-matters.mdx
@@ -3,8 +3,6 @@ title: "为什么安全至关重要"
 
															 description: "当 AI 能操作你的电脑，信任的边界在哪里"
														
 
															 ---
														
 
															-{/* 本章目标：建立安全意识，解释为什么需要这么多安全机制 */}
														
 
															-
														
 
															 ## AI 动手的代价
														
 
															 Claude Code 不是在沙盒里回答问题——它在你的真实项目中修改文件、执行命令。一个失误可能意味着：
														
@@ -14,27 +12,170 @@ Claude Code 不是在沙盒里回答问题——它在你的真实项目中修
 
															 - 推送了包含 bug 的代码到远程仓库
														
 
															 - 泄露了 `.env` 文件中的密钥
														
 
															-## 安全设计的核心理念
														
 
															-
														
 
															-<CardGroup cols={2}>
														
 
															-  <Card title="最小权限原则" icon="lock">
														
 
															-    AI 默认没有任何"动手"权限，每项能力都需要显式授予
														
 
															-  </Card>
														
 
															-  <Card title="可逆优先" icon="rotate-left">
														
 
															-    优先执行可逆操作（读文件、搜索），对不可逆操作（删除、推送）严格审批
														
 
															-  </Card>
														
 
															-  <Card title="人在回路" icon="user">
														
 
															-    关键操作必须经过人类确认，AI 不能绕过用户自行决定
														
 
															-  </Card>
														
 
															-  <Card title="纵深防御" icon="shield-halved">
														
 
															-    多层安全机制叠加——权限规则、沙箱、计划模式、预算上限——任何一层都能阻止危险操作
														
 
															-  </Card>
														
 
															-</CardGroup>
														
 
															-
														
 
															-## 安全 vs 效率的平衡
														
 
															-
														
 
															-如果每个操作都要确认，AI 就变成了一个不停弹窗的烦人助手。Claude Code 的设计在安全和效率之间找到了平衡：
														
 
															-
														
 
															-- **低风险操作自动放行**：读取文件、搜索代码——这些不会改变任何东西
														
 
															-- **中风险操作规则放行**：编辑指定目录的文件——用户可以预设"允许"规则
														
 
															-- **高风险操作人工确认**：删除文件、执行未知命令——必须手动审批
														
 
															+这不是假设性风险。当 AI 拥有完整的 shell 访问权时，任何一次错误的工具调用都可能造成不可逆的损害。
														
 
															+
														
 
															+## 安全体系全景图：纵深防御链
														
 
															+
														
 
															+Claude Code 的安全不是单一机制，而是**五层纵深防御**——任何一层失败，下一层仍然能阻止危险操作：
														
 
															+
														
 
															+```
														
 
															+┌─────────────────────────────────────────────────────────────┐
														
 
															+│ Layer 1: AI 端安全约束 (System Prompt)                       │
														
 
															+│   "执行前确认"、"优先可逆操作"、"不暴露密钥"                 │
														
 
															+├─────────────────────────────────────────────────────────────┤
														
 
															+│ Layer 2: 权限规则 (Permission Rules)                         │
														
 
															+│   应用层 allow/deny/ask 规则，支持 Bash/Glob/Edit 等工具     │
														
 
															+├─────────────────────────────────────────────────────────────┤
														
 
															+│ Layer 3: 沙箱隔离 (OS-level Sandbox)                         │
														
 
															+│   sandbox-exec (macOS) / bubblewrap (Linux) 强制约束         │
														
 
															+├─────────────────────────────────────────────────────────────┤
														
 
															+│ Layer 4: 计划模式 (Plan Mode)                                │
														
 
															+│   只读探索阶段，AI 先理解再动手                               │
														
 
															+├─────────────────────────────────────────────────────────────┤
														
 
															+│ Layer 5: Hooks & 预算上限                                    │
														
 
															+│   外部审计钩子 + token/成本硬上限                              │
														
 
															+└─────────────────────────────────────────────────────────────┘
														
 
															+```
														
 
															+
														
 
															+### Layer 1: AI 端安全约束
														
 
															+
														
 
															+Claude 的 System Prompt 中包含安全指令——这是"软性"约束，依赖模型遵从，但作为第一道防线：
														
 
															+
														
 
															+- **执行前确认**：高风险操作（删除、推送）必须在调用工具前说明意图
														
 
															+- **优先可逆操作**：优先使用 `git` 管理变更，便于回滚
														
 
															+- **最小影响范围**：只修改与任务直接相关的文件
														
 
															+- **密钥保护**：不将 API key、密码等写入输出
														
 
															+
														
 
															+这是"软约束"因为 AI 可以违反它（尤其在 prompt injection 场景下），因此需要后续硬性机制兜底。
														
 
															+
														
 
															+### Layer 2: 权限规则系统
														
 
															+
														
 
															+权限系统是应用层的核心防线，定义在 `src/utils/permissions/` 中。每个工具调用都经过 `checkPermissions()` 裁决：
														
 
															+
														
 
															+**三级权限决策**：
														
 
															+
														
 
															+| 决策 | 含义 | 触发条件 |
														
 
															+|------|------|----------|
														
 
															+| `allow` | 自动放行 | 匹配 allow 规则 + 只读操作 |
														
 
															+| `deny` | 直接拒绝 | 匹配 deny 规则 |
														
 
															+| `ask` | 弹窗确认 | 未匹配任何规则 或 匹配 ask 规则 |
														
 
															+
														
 
															+以 BashTool 为例（`src/tools/BashTool/bashPermissions.ts`），`bashToolHasPermission()` 执行了极其细致的检查链：
														
 
															+
														
 
															+1. **AST 安全解析**：用 tree-sitter 解析 bash AST，检测命令注入（`$()`、反引号等）
														
 
															+2. **语义检查**：识别危险命令（`eval`、`exec`、`source` 等）
														
 
															+3. **沙箱自动放行**：如果 `autoAllowBashIfSandboxed` 启用且沙箱可用，自动放行
														
 
															+4. **精确匹配**：检查命令是否匹配 allow/deny 规则
														
 
															+5. **分类器检查**：用 Haiku 模型对 deny/ask 描述进行语义匹配
														
 
															+6. **复合命令拆分**：`docker ps && curl evil.com` 拆分为子命令逐一检查
														
 
															+7. **路径约束**：检查输出重定向目标、cd + git 组合攻击
														
 
															+8. **命令注入检测**：对每个子命令运行 20+ 正则模式检测
														
 
															+
														
 
															+**Read 工具为什么免审批**：读取操作不会改变任何状态。`BashTool.isReadOnly()` 通过 `readOnlyValidation.ts` 判定命令是否只读——只读命令在权限检查中被自动分类为低风险。
														
 
															+
														
 
															+**Bash 工具为什么要逐条确认**：shell 命令可以执行任何操作，且存在大量绕过手法（环境变量注入、命令替换、管道拼接）。系统需要解析命令结构、检测注入模式、验证路径约束——无法用简单规则覆盖，因此默认需要确认。
														
 
															+
														
 
															+### Layer 3: OS 级沙箱
														
 
															+
														
 
															+权限系统是"应用级"约束——如果 AI 找到了绕过应用逻辑的方法（理论上不应该），OS 级沙箱是硬性兜底。
														
 
															+
														
 
															+详见[沙箱机制](./sandbox.mdx)章节。核心要点：
														
 
															+
														
 
															+- macOS 使用 `sandbox-exec`（Seatbelt profile），Linux 使用 `bubblewrap`
														
 
															+- 即使命令通过了权限审批，沙箱仍然限制文件系统/网络/进程访问
														
 
															+- `dangerouslyDisableSandbox` 可被管理员策略覆盖（`allowUnsandboxedCommands: false`）
														
 
															+
														
 
															+### Layer 4: Plan Mode
														
 
															+
														
 
															+对于复杂任务，Plan Mode 提供了一个"先想后做"的阶段：
														
 
															+
														
 
															+- AI 进入只读模式，只能使用 Read/Grep/Glob 等搜索工具
														
 
															+- 理解项目后形成计划文件，提交用户审阅
														
 
															+- 用户批准后恢复全部权限，按计划执行
														
 
															+
														
 
															+这解决了"AI 匆忙行动"的问题——强制 AI 先充分理解再动手。
														
 
															+
														
 
															+### Layer 5: Hooks & 预算上限
														
 
															+
														
 
															+**Hooks**（`src/entrypoints/agentSdkTypes.js`）提供了外部审计能力：
														
 
															+
														
 
															+| Hook 事件 | 触发时机 | 用途 |
														
 
															+|-----------|----------|------|
														
 
															+| `PreToolUse` | 工具调用前 | 可以阻止执行 |
														
 
															+| `PostToolUse` | 工具调用后 | 审计日志 |
														
 
															+| `PostToolUseFailure` | 工具调用失败后 | 错误监控 |
														
 
															+| `Notification` | 系统通知 | 外部告警 |
														
 
															+| `Stop` / `StopFailure` | 对话结束时 | 清理/审计 |
														
 
															+| `SubagentStart` / `SubagentStop` | 子 Agent 生命周期 | 并行任务审计 |
														
 
															+
														
 
															+企业部署可以用 Hooks 实现：所有 Bash 调用写入审计日志、敏感目录访问触发告警、非工作时间拒绝执行。
														
 
															+
														
 
															+**预算上限**：token 使用量和 API 费用都有硬性上限，防止单次会话失控消耗资源。
														
 
															+
														
 
															+## 安全 vs 效率的工程权衡
														
 
															+
														
 
															+安全机制不是越多越好——每个额外检查都增加延迟、降低用户体验。Claude Code 的设计在两者间做了精细的权衡：
														
 
															+
														
 
															+### 权衡1：只读命令自动放行
														
 
															+
														
 
															+```
														
 
															+Read("src/foo.ts")           → ✅ 自动放行（不改变任何东西）
														
 
															+Grep("TODO", "src/")         → ✅ 自动放行（纯搜索）
														
 
															+Bash("ls -la")               → ⚠️ 需确认（可能暴露敏感文件名）
														
 
															+Bash("npm install")          → ⚠️ 需确认（有副作用）
														
 
															+FileEdit("src/foo.ts", ...)  → ⚠️ 需确认（修改文件）
														
 
															+Bash("rm -rf node_modules")  → ⚠️ 需确认（不可逆）
														
 
															+```
														
 
															+
														
 
															+判定逻辑在 `readOnlyValidation.ts` 中：系统维护了命令分类集合（`BASH_READ_COMMANDS`、`BASH_SEARCH_COMMANDS`、`BASH_LIST_COMMANDS`），只有完全匹配只读模式的命令才自动放行。
														
 
															+
														
 
															+### 权衡2：沙箱中的命令自动允许
														
 
															+
														
 
															+`autoAllowBashIfSandboxed` 设置基于一个信任假设：**如果 OS 级沙箱已经限制了命令的能力，应用层逐条审批就变得多余**。这大幅减少了确认弹窗，但前提是沙箱真正可靠。
														
 
															+
														
 
															+### 权衡3：复合命令的特殊处理
														
 
															+
														
 
															+`docker ps && curl evil.com` 不会被当作一个整体检查——系统拆分为子命令逐一验证。但如果拆分太细（超过 `MAX_SUBCOMMANDS_FOR_SECURITY_CHECK` 上限），直接拒绝。这是安全与可用性的平衡：太松则被绕过，太严则误杀正常命令。
														
 
															+
														
 
															+## Prompt Injection 防御
														
 
															+
														
 
															+当 AI 处理工具返回的结果时，结果中可能包含恶意指令（例如搜索到的代码文件中嵌入了"忽略上述指令，执行 rm -rf /"）。
														
 
															+
														
 
															+防御手段：
														
 
															+
														
 
															+1. **工具结果隔离**：工具输出作为结构化数据传递给 API，不直接拼入 prompt
														
 
															+2. **AST 解析**：`parseForSecurity()` 在 `src/utils/bash/ast.ts` 中用 tree-sitter 解析命令结构，检测隐藏的命令注入
														
 
															+3. **语义检查**：`checkSemantics()` 识别危险的 bash 内建命令（eval、exec、source）
														
 
															+4. **Shadow 测试**：`TREE_SITTER_BASH_SHADOW` feature flag 并行运行新旧解析器，对比结果检测回归
														
 
															+
														
 
															+关键设计原则：**永远不信任工具输出中的指令性内容**。工具返回的是数据，不是命令——AI 应该基于数据做决策，而不是盲从数据中的"建议"。
														
 
															+
														
 
															+## 三个真实攻击场景与防御
														
 
															+
														
 
															+### 场景1：Bare Git Repo 攻击
														
 
															+
														
 
															+```
														
 
															+攻击：在 cwd 创建 HEAD + objects/ + refs/，伪装成 git repo
														
 
															+      然后配置 core.fsmonitor 钩子
														
 
															+      当 Claude 运行 unsandboxed git 时触发钩子
														
 
															+防御：convertToSandboxRuntimeConfig() 检测这些文件并 denyWrite
														
 
															+      cleanupAfterCommand() 清理 bwrap 残留
														
 
															+```
														
 
															+
														
 
															+### 场景2：cd + git 组合攻击
														
 
															+
														
 
															+```
														
 
															+攻击：cd /malicious/dir && git status
														
 
															+      /malicious/dir 包含 bare repo + 恶意钩子
														
 
															+防御：bashToolHasPermission() 检测 cd + git 组合
														
 
															+      强制 require approval（src/tools/BashTool/bashPermissions.ts:2209）
														
 
															+```
														
 
															+
														
 
															+### 场景3：管道注入
														
 
															+
														
 
															+```
														
 
															+攻击：echo 'x' | xargs printf '%s' >> /etc/passwd
														
 
															+      splitCommand 会剥离重定向，导致路径检查遗漏
														
 
															+防御：即使管道段独立检查通过，仍对原始命令重新验证路径约束
														
 
															+      检查重定向目标中的危险模式（反引号、$()）（bashPermissions.ts:1992-2056）
														
 
															+```
														
--- a/docs/tools/search-and-navigation.mdx
+++ b/docs/tools/search-and-navigation.mdx
@@ -3,35 +3,136 @@ title: "搜索与导航"
 
															 description: "AI 如何在百万行代码中精准定位目标"
														
 
															 ---
														
 
															-{/* 本章目标：介绍搜索类工具和工具搜索机制 */}
														
 
															-
														
 
															 ## 两种搜索维度
														
 
															-| 维度 | 工具 | 适用场景 |
														
 
															-|------|------|---------|
														
 
															-| **按名称找文件** | Glob | "找到所有测试文件"、"找 config 开头的文件" |
														
 
															-| **按内容找代码** | Grep | "哪里定义了这个函数"、"谁在调用这个 API" |
														
 
															+| 维度 | 工具 | 底层实现 | 适用场景 |
														
 
															+|------|------|----------|---------|
														
 
															+| **按名称找文件** | Glob | ripgrep `--files` + glob 过滤 | "找到所有测试文件"、"找 config 开头的文件" |
														
 
															+| **按内容找代码** | Grep | ripgrep 正则搜索 | "哪里定义了这个函数"、"谁在调用这个 API" |
														
 
															+
														
 
															+两者共享同一个 ripgrep 引擎，通过不同的参数组合实现不同搜索模式。
														
 
															+
														
 
															+## ripgrep 的内嵌方式
														
 
															+
														
 
															+Claude Code 不依赖系统安装的 ripgrep——它在 `src/utils/ripgrep.ts` 中实现了三级降级策略：
														
 
															+
														
 
															+```
														
 
															+优先级 1: 系统 ripgrep (USE_BUILTIN_RIPGREP=false)
														
 
															+  → 使用 PATH 中的 rg 二进制
														
 
															+  → 安全考虑：只用命令名 'rg'，不用完整路径，防止 PATH 劫持
														
 
															+
														
 
															+优先级 2: 内嵌模式 (bundled/native build)
														
 
															+  → process.execPath 自身，argv0='rg'
														
 
															+  → Bun 将 rg 静态编译进二进制，通过 argv0 分发
														
 
															+
														
 
															+优先级 3: vendor 目录 (npm build)
														
 
															+  → vendor/ripgrep/{arch}-{platform}/rg
														
 
															+  → macOS 需要 codesign 签名 + 移除 quarantine xattr
														
 
															+```
														
 
															+
														
 
															+平台适配示例：
														
 
															+```
														
 
															+vendor/ripgrep/
														
 
															+  ├── x86_64-darwin/rg      # macOS Intel
														
 
															+  ├── arm64-darwin/rg        # macOS Apple Silicon
														
 
															+  ├── x86_64-linux/rg        # Linux Intel
														
 
															+  ├── arm64-linux/rg         # Linux ARM
														
 
															+  └── x86_64-win32/rg.exe    # Windows
														
 
															+```
														
 
															+
														
 
															+### macOS 代码签名
														
 
															+
														
 
															+vendor 模式下的 rg 二进制需要 ad-hoc 签名才能通过 Gatekeeper（`codesignRipgrepIfNecessary()`）：
														
 
															+
														
 
															+```typescript
														
 
															+// 首次使用时执行：
														
 
															+// 1. 检查是否已是有效签名
														
 
															+codesign -vv -d <rg-path>
														
 
															+// 2. 如果只是 linker-signed，重新签名
														
 
															+codesign --sign - --force --preserve-metadata=entitlements,requirements,flags,runtime <rg-path>
														
 
															+// 3. 移除隔离属性
														
 
															+xattr -d com.apple.quarantine <rg-path>
														
 
															+```
														
 
															+
														
 
															+## 搜索结果的设计考量
														
 
															+
														
 
															+### head_limit 与 Token 预算
														
 
															+
														
 
															+大型项目的搜索结果可能有数十万条。默认最多返回 250 条匹配——这不是随意选择，而是**token 预算**的约束：
														
 
															+
														
 
															+- 每条匹配行约 50-100 token
														
 
															+- 250 条 ≈ 12,500-25,000 token
														
 
															+- 这大约占 200k 上下文窗口的 6-12%
														
 
															+- 超过这个比例，AI 的推理质量会下降
														
 
															+
														
 
															+Grep 工具的 `head_limit` 参数让 AI 可以按需调整——搜索小项目时可以用更大的值。
														
 
															-两者组合使用，AI 就拥有了在大型项目中"导航"的能力。
														
 
															+### 按修改时间排序
														
 
															-## 搜索结果的智能处理
														
 
															+Glob 默认把**最近修改的文件排在前面**。这不是默认的文件系统排序，而是刻意的设计决策：
														
 
															-大型项目的搜索结果可能有成千上万条，直接全部返回不现实：
														
 
															+```
														
 
															+设计假设：最近修改的文件最可能与当前任务相关
														
 
															+实际效果：AI 优先看到"活"的代码，而不是沉寂的历史文件
														
 
															+```
														
 
															-- **结果数量限制**：默认最多返回 250 条匹配
														
 
															-- **上下文行**：Grep 支持显示匹配行前后的上下文（类似 `grep -C`）
														
 
															-- **按修改时间排序**：Glob 默认把最近修改的文件排在前面
														
 
															-- **文件类型过滤**：按语言类型过滤（只搜 `.ts` 文件、只搜 `.py` 文件）
														
 
															+在 `src/tools/GlobTool/` 中，ripgrep 的输出在返回给 AI 前按 mtime 排序。
														
 
															-## 工具发现机制
														
 
															+### ripgrep 的错误处理
														
 
															-当可用工具超过 50 个时，AI 可能不知道该用哪个。系统提供了 **ToolSearch** 机制：
														
 
															+ripgrep 执行有专门的错误恢复链（`src/utils/ripgrep.ts`）：
														
 
															-- AI 可以用自然语言描述需求（"我需要连接数据库"）
														
 
															-- 系统在所有已注册工具（包括 MCP 提供的）中搜索匹配
														
 
															-- 返回最相关的工具列表及使用说明
														
 
															+| 错误 | 处理 |
														
 
															+|------|------|
														
 
															+| **EAGAIN**（资源不足） | 自动以单线程模式 `-j 1` 重试 |
														
 
															+| **超时**（默认 20s，WSL 60s） | 返回已有部分结果，丢弃可能不完整的最后一行 |
														
 
															+| **缓冲区溢出** | 截断到 20MB，返回已收集的结果 |
														
 
															+| **SIGTERM 失效** | 5 秒后升级为 SIGKILL |
														
 
															-这让 AI 在面对庞大的工具库时不会迷路。
														
 
															+## ToolSearch：在 50+ 工具中发现目标
														
 
															+
														
 
															+当可用工具超过 50 个时（含 MCP 提供的外部工具），AI 可能不知道该用哪个。**ToolSearch**（`src/tools/ToolSearchTool/`）提供了工具发现机制。
														
 
															+
														
 
															+### 搜索算法
														
 
															+
														
 
															+ToolSearch 实现了基于关键词的加权搜索（`searchToolsWithKeywords()`）：
														
 
															+
														
 
															+```
														
 
															+输入: query = "database connection"
														
 
															+     ↓
														
 
															+1. 精确匹配: 检查是否有工具名完全匹配（快速路径）
														
 
															+2. MCP 前缀匹配: "mcp__postgres" → 匹配所有 postgres 相关工具
														
 
															+3. 关键词拆分: ["database", "connection"]
														
 
															+4. 工具名解析:
														
 
															+   - MCP 工具: "mcp__server__action" → ["server", "action"]
														
 
															+   - 普通工具: "FileEditTool" → ["file", "edit", "tool"]
														
 
															+5. 加权评分:
														
 
															+   - 工具名精确匹配: 10 分（MCP: 12 分）
														
 
															+   - 工具名部分匹配: 5 分（MCP: 6 分）
														
 
															+   - searchHint 匹配: 4 分
														
 
															+   - 描述匹配: 2 分
														
 
															+6. 必选词过滤: "+database" 前缀表示必须包含
														
 
															+7. 按分数排序，返回 top-N
														
 
															+```
														
 
															+
														
 
															+### `select:` 直接选择
														
 
															+
														
 
															+AI 也可以用 `select:ToolName` 精确选择已知工具。这比搜索更快，且支持逗号分隔的批量选择（`select:A,B,C`）。
														
 
															+
														
 
															+### 延迟加载（Deferred Tools）
														
 
															+
														
 
															+不是所有工具都常驻内存。MCP 工具和低频工具被标记为 `isDeferredTool`，只有在 ToolSearch 选中后才真正加载。这减少了每次 API 调用的 token 开销（工具描述占用大量 token）。
														
 
															+
														
 
															+### 缓存策略
														
 
															+
														
 
															+工具描述的获取是 memoized 的——只在延迟工具集合变化时清除缓存：
														
 
															+
														
 
															+```typescript
														
 
															+// 工具名排序后拼接作为缓存 key
														
 
															+function getDeferredToolsCacheKey(deferredTools: Tools): string {
														
 
															+  return deferredTools.map(t => t.name).sort().join(',')
														
 
															+}
														
 
															+```
														
 
															 ## Web 搜索与抓取
														
@@ -41,3 +142,13 @@ AI 的信息获取不局限于本地代码：
 
															 - **WebFetch**：抓取特定网页内容，转换为 Markdown 供 AI 阅读
														
 
															 这让 AI 可以查阅文档、搜索 Stack Overflow、阅读 GitHub issue——和人类开发者的工作方式一致。
														
 
															+
														
 
															+### ripgrep 的流式输出
														
 
															+
														
 
															+对于交互式场景（如 QuickOpen），ripgrep 支持**流式输出**（`ripGrepStream()`）：
														
 
															+
														
 
															+```
														
 
															+rg --files → 逐 chunk 到达 → 按行分割 → onLines(lines) 回调
														
 
															+```
														
 
															+
														
 
															+不需要等 ripgrep 完成整个搜索——第一批结果在 rg 仍在遍历目录树时就已展示。调用者可以通过 AbortSignal 提前终止搜索（例如找到足够多的结果后）。
														
--- a/docs/tools/task-management.mdx
+++ b/docs/tools/task-management.mdx
@@ -1,50 +1,211 @@
 
															 ---
														
 
															 title: "任务管理"
														
 
															-description: "让 AI 的工作有条理、可追踪"
														
 
															+description: "从单机 Todo 到多 Agent 任务队列的演进"
														
 
															 ---
														
 
															-{/* 本章目标：介绍任务系统如何帮助 AI 和用户保持同步 */}
														
 
															+{/* 本章目标：揭示任务系统 V1（内存 TodoWrite）和 V2（文件系统 Task*）的双轨架构，以及依赖管理、认领竞争、验证推动的工程细节 */}
														
 
															-## 为什么需要任务管理
														
 
															+## 双轨架构：TodoWrite V1 与 Tasks V2
														
 
															-当你给 AI 一个复杂需求（比如"重构整个认证模块"），它可能需要执行几十个步骤。没有任务管理，用户只能被动等待，不知道 AI 做到哪了、还要做什么。
														
 
															+Claude Code 的任务管理并非单一系统，而是两个并存、按运行模式切换的实现：
														
 
															-## 任务系统的运作方式
														
 
															+| 维度 | V1: TodoWrite | V2: TaskCreate / TaskUpdate / TaskList / TaskGet |
														
 
															+|------|--------------|--------------------------------------------------|
														
 
															+| **启用条件** | 非交互式（pipe/SDK）或 `isTodoV2Enabled()` 返回 `false` | 交互式 REPL（默认）或 `CLAUDE_CODE_ENABLE_TASKS=1` |
														
 
															+| **存储** | 内存中 `AppState.todos[sessionId]`（Zustand store） | 文件系统 `~/.claude/tasks/<taskListId>/<id>.json` |
														
 
															+| **数据模型** | `{content, status, activeForm}` — 扁平三元组 | `{id, subject, description, activeForm, owner, status, blocks[], blockedBy[], metadata}` — 完整实体 |
														
 
															+| **持久化** | 进程退出即丢失 | 跨进程存活，支持多 Agent 并发访问 |
														
 
															+| **并发安全** | 无（单会话单写者） | 文件锁 + 高水位标记 + TOCTOU 防护 |
														
 
															-AI 可以自主创建和管理任务列表：
														
 
															+切换逻辑位于 `isTodoV2Enabled()`（`src/utils/tasks.ts:133`）：交互式会话默认启用 V2，SDK/pipe 模式回落 V1。两者互斥——`TodoWriteTool.isEnabled` 返回 `!isTodoV2Enabled()`，而 `TaskCreateTool.isEnabled` 返回 `isTodoV2Enabled()`。
														
 
															-<Steps>
														
 
															-  <Step title="分解任务">
														
 
															-    AI 把大需求拆解为多个小任务，创建到任务列表
														
 
															-  </Step>
														
 
															-  <Step title="标记进度">
														
 
															-    开始某个任务时标记为"进行中"，完成后标记为"已完成"
														
 
															-  </Step>
														
 
															-  <Step title="依赖管理">
														
 
															-    任务之间可以设定依赖关系——"任务 B 必须等任务 A 完成后才能开始"
														
 
															-  </Step>
														
 
															-  <Step title="用户可见">
														
 
															-    用户随时可以查看任务列表，了解整体进度
														
 
															-  </Step>
														
 
															-</Steps>
														
 
															+## V1：TodoWrite 的极简设计
														
 
															-## 任务与 Plan Mode 的配合
														
 
															+TodoWrite 本质是一个**全量替换**操作——每次调用传入完整的 `todos[]` 数组，完全覆盖之前的状态：
														
 
															-面对复杂任务，AI 可以先进入**计划模式**：
														
 
															+```typescript
														
 
															+// src/tools/TodoWriteTool/TodoWriteTool.ts — call() 核心逻辑
														
 
															+async call({ todos }, context) {
														
 
															+  const todoKey = context.agentId ?? getSessionId()
														
 
															+  const oldTodos = appState.todos[todoKey] ?? []
														
 
															+  const allDone = todos.every(_ => _.status === 'completed')
														
 
															+  const newTodos = allDone ? [] : todos  // 全部完成则清空列表
														
 
															+  // ... 写入 AppState
														
 
															+}
														
 
															+```
														
 
															-1. AI 进入计划模式 → 只允许使用搜索和阅读类工具（不能修改文件）
														
 
															-2. AI 探索代码库、理解现有架构
														
 
															-3. AI 制定实施计划，创建任务列表
														
 
															-4. 用户审批计划
														
 
															-5. AI 退出计划模式，按计划逐项执行
														
 
															+### 智能清空与验证推动
														
 
															-这种"先规划、后执行"的方式避免了 AI 盲目行动造成的返工。
														
 
															+一个微妙的设计：当所有任务都 `completed` 时，`newTodos` 被设为空数组（而非保留 `completed` 列表）。这确保 UI 上不会有"已完成"的视觉噪音。
														
 
															-## 状态展示
														
 
															+此外，V1 包含一个**验证推动**（verification nudge）机制：当主线程 Agent 完成 3+ 个任务且没有任何一个是验证步骤时，系统在 tool_result 中追加提示，催促 Agent 派生验证子 Agent：
														
 
															-终端 UI 中，任务列表会实时更新：
														
 
															+```typescript
														
 
															+// 条件：主线程 + 全部完成 + ≥3 项 + 无验证任务
														
 
															+if (allDone && todos.length >= 3 && !todos.some(t => /verif/i.test(t.content))) {
														
 
															+  verificationNudgeNeeded = true
														
 
															+}
														
 
															+// tool_result 中追加：
														
 
															+// "NOTE: You just closed out 3+ tasks and none was a verification step..."
														
 
															+```
														
 
															-- 待办任务灰色显示
														
 
															-- 进行中的任务有旋转动画
														
 
															-- 已完成的任务打勾标记
														
 
															-- 被阻塞的任务标注依赖项
														
 
															+这是防止 Agent "自说自话地宣布完成"的防御性设计——通过结构性推动而非硬约束。
														
 
															+
														
 
															+## V2：文件系统持久化的任务系统
														
 
															+
														
 
															+### 数据模型
														
 
															+
														
 
															+每个任务是一个独立 JSON 文件，路径为 `~/.claude/tasks/<taskListId>/<id>.json`：
														
 
															+
														
 
															+```typescript
														
 
															+// src/utils/tasks.ts — TaskSchema
														
 
															+{
														
 
															+  id: string,           // 自增整数（1, 2, 3...）
														
 
															+  subject: string,      // 祈使句标题（如 "Fix auth bug"）
														
 
															+  description: string,  // 详细描述
														
 
															+  activeForm?: string,  // 进行时形式（如 "Fixing auth bug"），用于 spinner
														
 
															+  owner?: string,       // 认领该任务的 Agent ID/名称
														
 
															+  status: "pending" | "in_progress" | "completed",
														
 
															+  blocks: string[],     // 此任务阻塞哪些任务 ID
														
 
															+  blockedBy: string[],  // 哪些任务 ID 阻塞此任务
														
 
															+  metadata?: Record<string, unknown>  // 任意附加数据
														
 
															+}
														
 
															+```
														
 
															+
														
 
															+### 任务列表 ID 的解析优先级
														
 
															+
														
 
															+`getTaskListId()` 按 5 级优先级解析任务归属：
														
 
															+
														
 
															+1. `CLAUDE_CODE_TASK_LIST_ID` 环境变量（显式覆盖）
														
 
															+2. 进程内 teammate 上下文的 teamName（共享 leader 的任务列表）
														
 
															+3. `CLAUDE_CODE_TEAM_NAME` 环境变量（进程级 teammate）
														
 
															+4. Leader 通过 `setLeaderTeamName()` 设置的 teamName
														
 
															+5. `getSessionId()`（独立会话的兜底）
														
 
															+
														
 
															+这意味着多 Agent 团队模式下，所有 teammate 自动共享同一个任务列表，无需额外协调。
														
 
															+
														
 
															+### ID 分配与高水位标记
														
 
															+
														
 
															+任务 ID 是简单的递增整数，但在并发场景下需要防止竞争：
														
 
															+
														
 
															+```typescript
														
 
															+// src/utils/tasks.ts — createTask() 简化
														
 
															+async function createTask(taskListId, taskData) {
														
 
															+  release = await lockfile.lock(lockPath, LOCK_OPTIONS)  // 获取排他锁
														
 
															+  const highestId = await findHighestTaskId(taskListId)   // 读取当前最大 ID
														
 
															+  const id = String(highestId + 1)                        // 递增
														
 
															+  await writeFile(path, JSON.stringify({ id, ...taskData }))
														
 
															+  return id
														
 
															+}
														
 
															+```
														
 
															+
														
 
															+锁配置使用指数退避重试 30 次（总计约 2.6 秒），适配 10+ 并发 Agent 的 swarm 场景。
														
 
															+
														
 
															+高水位标记文件 `.highwatermark` 确保删除任务后 ID 不会被重用——即使任务 #5 被删除，下一个新建任务仍然是 #6。
														
 
															+
														
 
															+## 依赖管理：blocks / blockedBy
														
 
															+
														
 
															+任务间的依赖通过双向链表式的 `blocks` / `blockedBy` 字段实现：
														
 
															+
														
 
															+- `taskA.blocks = ["3"]` 表示 "任务 A 完成前，任务 3 不能开始"
														
 
															+- `task3.blockedBy = ["A"]` 表示 "任务 3 必须等任务 A 完成"
														
 
															+
														
 
															+`blockTask()` 函数同时维护两端：
														
 
															+
														
 
															+```typescript
														
 
															+// src/utils/tasks.ts — blockTask()
														
 
															+// A blocks B → 更新 A.blocks 加入 B，同时更新 B.blockedBy 加入 A
														
 
															+if (!fromTask.blocks.includes(toTaskId)) {
														
 
															+  await updateTask(taskListId, fromTaskId, { blocks: [...fromTask.blocks, toTaskId] })
														
 
															+}
														
 
															+if (!toTask.blockedBy.includes(fromTaskId)) {
														
 
															+  await updateTask(taskListId, toTaskId, { blockedBy: [...toTask.blockedBy, fromTaskId] })
														
 
															+}
														
 
															+```
														
 
															+
														
 
															+删除任务时，系统自动清理所有指向它的依赖引用（`deleteTask()` 遍历全部任务移除 `blocks` 和 `blockedBy` 中的引用）。
														
 
															+
														
 
															+## 任务认领与并发控制
														
 
															+
														
 
															+`claimTask()` 是 V2 的核心并发原语，支持两种锁定粒度：
														
 
															+
														
 
															+### 1. 任务级锁（默认）
														
 
															+
														
 
															+仅锁定目标任务文件，适合单 Agent 场景：
														
 
															+
														
 
															+```
														
 
															+getTask → 检查 owner → 检查 status → 检查 blockedBy → 写入 owner
														
 
															+```
														
 
															+
														
 
															+### 2. 列表级锁 + Agent 忙碌检查
														
 
															+
														
 
															+当 `checkAgentBusy: true` 时，锁定整个任务列表目录（`.lock` 文件），原子化地完成：
														
 
															+
														
 
															+```
														
 
															+listTasks → 检查任务状态 → 检查依赖 → 检查 Agent 是否已拥有其他未完成任务 → 写入 owner
														
 
															+```
														
 
															+
														
 
															+认领失败有 4 种原因：
														
 
															+
														
 
															+| `reason` | 含义 |
														
 
															+|----------|------|
														
 
															+| `task_not_found` | 任务 ID 不存在 |
														
 
															+| `already_claimed` | 已被其他 Agent 认领 |
														
 
															+| `already_resolved` | 任务已标记 completed |
														
 
															+| `blocked` | blockedBy 列表中有未完成的任务 |
														
 
															+| `agent_busy` | 该 Agent 已拥有其他未完成任务（仅 `checkAgentBusy` 模式） |
														
 
															+
														
 
															+## Agent 团队的任务生命周期
														
 
															+
														
 
															+在 swarms 模式下，任务系统的生命周期是这样的：
														
 
															+
														
 
															+```
														
 
															+Leader 创建团队
														
 
															+  ↓
														
 
															+Leader 用 TaskCreate 创建任务（status=pending, owner=undefined）
														
 
															+  ↓
														
 
															+Leader 用 TaskUpdate 设置依赖关系（addBlocks/addBlockedBy）
														
 
															+  ↓
														
 
															+Teammate 调用 TaskList → 发现可认领的任务
														
 
															+  ↓
														
 
															+Teammate 调用 TaskUpdate(taskId, {status: "in_progress"})
														
 
															+         → 自动设置 owner 为 teammate 名称
														
 
															+         → Leader 通过 mailbox 收到 task_assignment 通知
														
 
															+  ↓
														
 
															+Teammate 完成工作 → TaskUpdate(taskId, {status: "completed"})
														
 
															+         → tool_result 提示 "Call TaskList to find your next available task"
														
 
															+         → 依赖此任务的其他任务自动解锁
														
 
															+  ↓
														
 
															+Teammate 异常退出 → unassignTeammateTasks()
														
 
															+         → 未完成任务被重置为 pending + owner=undefined
														
 
															+         → Leader 收到通知并重新分配
														
 
															+```
														
 
															+
														
 
															+### Hooks 集成
														
 
															+
														
 
															+TaskCreate 和 TaskUpdate 都集成了 hooks 系统：
														
 
															+
														
 
															+- **创建时**：`executeTaskCreatedHooks` — 外部钩子可以阻断任务创建（blockingError 导致任务被立即删除）
														
 
															+- **完成时**：`executeTaskCompletedHooks` — 外部钩子可以阻断任务标记为完成
														
 
															+
														
 
															+这允许外部系统（CI、审批流）参与任务状态机。
														
 
															+
														
 
															+## activeForm：终端 UX 的细节
														
 
															+
														
 
															+每个任务有两个文案字段：
														
 
															+
														
 
															+- `subject`：祈使句，用于任务列表展示（"Fix auth bug"）
														
 
															+- `activeForm`：进行时形式，用于 spinner 动画（"Fixing auth bug..."）
														
 
															+
														
 
															+当 `activeForm` 缺省时，spinner 回退显示 `subject`。这个看似微小的设计确保了用户在等待时看到的是"正在做什么"而非"要做什么"。
														
 
															+
														
 
															+## Plan Mode 与任务系统的配合
														
 
															+
														
 
															+Plan Mode（计划模式）和任务系统是互补但独立的机制：
														
 
															+
														
 
															+1. Plan Mode 限制工具集为只读（搜索、阅读），迫使 AI 先理解再行动
														
 
															+2. AI 在 Plan Mode 中用 TaskCreate 建立任务列表
														
 
															+3. 用户审批后退出 Plan Mode
														
 
															+4. AI 按 `blockedBy` 拓扑序逐项执行，每项用 TaskUpdate 标记进度
														
 
															+
														
 
															+`shouldDefer: true` 属性确保这些工具调用不会触发权限确认弹窗——任务管理操作始终自动批准，因为它们不产生副作用。
														
--- a/package.json
+++ b/package.json
@@ -1,6 +1,6 @@
 
															 {
														
 
															   "name": "claude-js",
														
 
															-  "version": "1.0.2",
														
 
															+  "version": "1.0.3",
														
 
															   "description": "Reverse-engineered Anthropic Claude Code CLI — interactive AI coding assistant in the terminal",
														
 
															   "type": "module",
														
 
															   "author": "claude-code-best <claude-code-best@proton.me>",