逐行拆解 Anthropic 官方 skill-creator 源码一个用来「造技能的技能」。
核心发现:
→ Grader/Comparator/Analyzer 三智能体评估架构
→ Blinded History:改进模型完全看不到测试集,标准 ML 防过拟合
→ 流式事件检测触发率,不是正则匹配
→ 把 description 优化建模为搜索问题( train/test split + 自动迭代)
做 AI Agent 工程化的同学值得一读。
https://mp.weixin.qq.com/s/TFZ9-jmbZ6cZnonlzzViHg