给 Cursor、Codex、Claude Code 用的 AI Skill,到底该怎么测

Posted on 一 20 4月 2026 in Journal • Tagged with AI, Agent Skills, Cursor, Claude Code, Codex, Testing, Evaluation, CI

上一篇讲过用 promptfoo 测 LLM API 类的 AI skill。可咱们日常写的更多是另一种——给 Cursor、Codex、Claude Code 用的本地 skill,它没有 endpoint,没有固定 prompt,调用方是另一个 agent。这种 skill 该怎么测?本文给一套从结构 lint 到行为回归的完整方案。


Continue reading

Agent Skills:给 AI 助手装上"技能包"

Posted on 六 31 1月 2026 in AI • Tagged with AI, Agent Skills, Cursor, Claude-Code, 编程工具

AI 助手越来越强,但总是"差点意思"——它知道怎么写代码,却不知道你们团队的规范;它能生成文档,却不懂你们公司的模板。Agent Skills 是一个简单、开放的格式,让你给 AI 装上"技能包",把领域知识和工作流程打包成可复用的能力。


Continue reading