growthbook-ab-testing.mdx 5.7 KB

123456789101112131415161718192021222324252627282930313233343536373839404142434445464748495051525354555657585960616263646566676869707172737475767778798081828384858687888990919293949596979899100101102103104105106107108109110111112113114115116117118119
  1. ---
  2. title: "千面千人:GrowthBook A/B 测试体系"
  3. description: "揭秘 Claude Code 如何通过 GrowthBook 实现运行时 A/B 测试和渐进式功能发布"
  4. ---
  5. {/* 本章目标:深入运行时 A/B 测试层——GrowthBook 的集成架构、用户定向、tengu 命名文化 */}
  6. ## 为什么需要运行时 A/B 测试
  7. 构建时 `feature()` 是"全有或全无"的——要么所有用户都有,要么所有用户都没有。但产品团队需要更精细的控制:
  8. - 只对 5% 的用户灰度发布新功能
  9. - 按订阅类型(Free / Pro / Team)差异化体验
  10. - 对特定组织静默开启实验性能力
  11. - 随时远程关闭出问题的功能,无需发版
  12. 这就是 **GrowthBook** 的用武之地——一个运行时的、基于用户属性的功能门控和 A/B 测试系统。
  13. ## 集成架构
  14. GrowthBook 的完整实现位于 `src/services/analytics/growthbook.ts`(1156 行),工作流程如下:
  15. <Steps>
  16. <Step title="启动时获取远程配置">
  17. CLI 启动时,GrowthBook SDK 通过 `https://api.anthropic.com/` 的 API 端点获取当前的功能配置和实验分组规则。使用 `remoteEval: true` 模式——在服务端计算分组,客户端只拿结果。
  18. </Step>
  19. <Step title="计算用户属性">
  20. SDK 收集当前用户的属性(设备 ID、订阅类型、组织 UUID 等),用于决定该用户属于哪些实验的哪个分组。
  21. </Step>
  22. <Step title="缓存到本地">
  23. 计算结果缓存到 `~/.claude.json` 的 `cachedGrowthBookFeatures` 字段。刷新间隔:Anthropic 员工 20 分钟,外部用户 6 小时。
  24. </Step>
  25. <Step title="代码中查询 flag">
  26. 业务代码通过 `tengu_*` 前缀的 flag 名查询功能状态,GrowthBook SDK 返回当前用户的分组值。
  27. </Step>
  28. </Steps>
  29. ## 用户定向属性
  30. GrowthBook 根据以下用户属性决定实验分组:
  31. | 属性 | 类型 | 来源 | 用途 |
  32. |------|------|------|------|
  33. | `id` | string | 会话 ID | 按会话粒度分组 |
  34. | `deviceID` | string | 持久化设备标识 | 跨会话一致性 |
  35. | `sessionId` | string | 当前会话 ID | 会话级实验 |
  36. | `platform` | enum | `process.platform` | 按操作系统差异化 |
  37. | `organizationUUID` | string | API 认证信息 | 按组织灰度 |
  38. | `accountUUID` | string | API 认证信息 | 按个人账户灰度 |
  39. | `subscriptionType` | string | API 认证信息 | Free / Pro / Team 差异化 |
  40. | `rateLimitTier` | string | API 认证信息 | 按速率限制层级 |
  41. | `email` | string | API 认证信息 | 精确定向特定用户 |
  42. | `appVersion` | string | `MACRO.VERSION` | 按版本号灰度 |
  43. | `github` | object | GitHub Actions 元数据 | CI 环境特殊处理 |
  44. <Note>
  45. 这套定向系统意味着 Anthropic 可以做非常精细的实验——比如"只对 Mac 上的 Pro 订阅用户的 10% 开启新功能"。
  46. </Note>
  47. ## 代号文化:tengu_* 的世界
  48. 所有运行时 flag 都以 `tengu_` 为前缀——"Tengu"(天狗)是 Claude Code 的内部项目代号。flag 名采用**动物/植物/矿物 + 形容词**的命名约定,刻意保持不透明。
  49. <AccordionGroup>
  50. <Accordion title="tengu_kairos — Kairos 助手模式">
  51. 控制 KAIROS 功能的运行时开关。即使构建时 `feature('KAIROS')` 通过,仍需此 flag 命中才能激活。双重门控确保新功能可以分阶段发布。
  52. </Accordion>
  53. <Accordion title="tengu_amber_stoat — Explore Agent A/B 测试">
  54. 控制内置的 Explore 子 Agent 的行为变体。"amber stoat"(琥珀色白鼬)是随机生成的代号,与功能内容无关——这是为了防止通过 flag 名猜测功能。
  55. </Accordion>
  56. <Accordion title="tengu_auto_background_agents — 后台 Agent 自动化">
  57. 控制是否自动将某些任务分派给后台 Agent 执行,而不是在前台阻塞用户。
  58. </Accordion>
  59. <Accordion title="tengu_onyx_plover — Auto-Dream 后台记忆">
  60. 控制"自动做梦"功能——在空闲时后台整理和巩固 Agent 的记忆。"onyx plover"(玛瑙鸻)又是一个不透明代号。
  61. </Accordion>
  62. <Accordion title="tengu_glacier_2xr — 工具搜索行为">
  63. 控制 Tool Search 的行为变体,可能是搜索算法或排序策略的 A/B 测试。
  64. </Accordion>
  65. <Accordion title="tengu_birch_trellis — Bash 权限策略">
  66. 控制 BashTool 权限判断的策略变体——可能在测试更宽松或更严格的权限规则。
  67. </Accordion>
  68. <Accordion title="tengu_scratch — 草稿本功能">
  69. 控制一个实验性的"草稿本"功能,可能是让 AI 在处理复杂任务时使用中间暂存区。
  70. </Accordion>
  71. <Accordion title="tengu_quartz_lantern — Diff 计算策略">
  72. 控制文件写入和编辑时的 diff 计算方式。可能在 A/B 测试不同的 diff 算法对用户体验的影响。
  73. </Accordion>
  74. </AccordionGroup>
  75. ## Ant-Only 覆盖机制
  76. Anthropic 员工拥有两种方式绕过 GrowthBook 的远程求值:
  77. ### 环境变量覆盖
  78. ```bash
  79. # 仅在 USER_TYPE=ant 的构建中生效
  80. CLAUDE_INTERNAL_FC_OVERRIDES='{"tengu_kairos": true}' claude
  81. ```
  82. 通过 `CLAUDE_INTERNAL_FC_OVERRIDES` 环境变量传入 JSON 对象,直接覆盖任意 flag 的值。
  83. ### Config 界面覆盖
  84. 在内部构建中,`/config` 命令的 Gates 标签页提供了图形化的 flag 管理界面,可以实时切换任意 GrowthBook flag。
  85. ## 实验追踪
  86. GrowthBook 集成了完整的实验曝光追踪:
  87. - 每次查询 flag 时记录实验曝光事件
  88. - 通过 protobuf 格式的 `GrowthbookExperimentEvent` 上报
  89. - 包含 `variation_id`(0=对照组,1+=实验组)和 `in_experiment` 标记
  90. - 数据用于分析功能对用户行为的因果影响
  91. <Note>
  92. GrowthBook 正在从 Statsig 迁移而来——代码中仍保留着 `checkStatsigFeatureGate_CACHED_MAY_BE_STALE()` 这样的迁移兼容层。
  93. </Note>