给 Cursor、Codex、Claude Code 用的 AI Skill,到底该怎么测

Posted on 一 20 4月 2026 in Journal • Tagged with AI, Agent Skills, Cursor, Claude Code, Codex, Testing, Evaluation, CI

上一篇讲过用 promptfoo 测 LLM API 类的 AI skill。可咱们日常写的更多是另一种——给 Cursor、Codex、Claude Code 用的本地 skill,它没有 endpoint,没有固定 prompt,调用方是另一个 agent。这种 skill 该怎么测?本文给一套从结构 lint 到行为回归的完整方案。


Continue reading

从 Prompt Engineering 到 Harness Engineering:AI 编程的四次进化

Posted on 六 28 3月 2026 in Tech • Tagged with harness-engineering, AI, prompt-engineering, context-engineering, Tauri, Rust, Claude Code

OpenAI 用 Codex 在五个月内生成了百万行代码,零行手写。背后的方法论叫 Harness Engineering——不是教 AI 怎么写代码,而是给 AI 搭一个"跑不偏"的环境。本文梳理从 Prompt Engineering 到 Harness Engineering 的四次进化,并用一个实战案例演示:一个不会 Rust 的老程序员,如何靠 Harness Engineering 用 Tauri 写出一个桌面 Todo 应用。


Continue reading

如何写好一个 AI Skill:让 AI Agent 从"什么都会"变成"真的能干活"

Posted on 二 17 3月 2026 in Tech • Tagged with AI, Skill, Agent, Prompt Engineering, Claude Code, Cursor, 方法论

AI Agent 就像你新招的天才实习生——什么都学过,但到了你的项目里,连 CI 怎么跑都不知道。AI Skill 就是那份"入职培训手册",把你的领域知识、工作流程、最佳实践打包成 AI 能理解和执行的模块。本文拆解写好 AI Skill 的方法、原则、示例和自检清单。


Continue reading

claude code 平替: opencode + deepseek/qwen

Posted on 三 25 2月 2026 in Tech • Tagged with opencode, claude-code, qwen, deepseek, openai-compatible, ai-sdk, tls, ca

用 opencode 接入公司私有部署的 Qwen/DeepSeek(OpenAI-compatible API),日常写代码、改文档基本够用,还能省掉订阅费与 token 焦虑;关键是把 TLS 自签证书这关过掉,别用“关掉校验”这种野路子。


Continue reading

如何打造个人与项目知识库:从全文搜索到 RAG,再到 Claude Skill

Posted on 四 05 2月 2026 in AI • Tagged with 知识库, 全文搜索, RAG, Claude-Code, Cursor, 写作方法

很多人一上来就要“搞 RAG”,结果三天后变成“搞不下去”。真正能跑起来的知识库,往往从最土的全文搜索开始:先能找、再能用、最后才谈自动化。本文给一条可落地的路线:全文搜索 → 轻量 RAG → 把流程封装成 Claude Skill / Cursor command。


Continue reading

Agent Skills:给 AI 助手装上"技能包"

Posted on 六 31 1月 2026 in AI • Tagged with AI, Agent Skills, Cursor, Claude-Code, 编程工具

AI 助手越来越强,但总是"差点意思"——它知道怎么写代码,却不知道你们团队的规范;它能生成文档,却不懂你们公司的模板。Agent Skills 是一个简单、开放的格式,让你给 AI 装上"技能包",把领域知识和工作流程打包成可复用的能力。


Continue reading

Claude Code 使用技巧与成本控制指南

Posted on 四 22 1月 2026 in AI • Tagged with AI, Claude-Code, Cost Control, Development Tools, best-practices

Claude Code 是 Anthropic 推出的命令行 AI 编程工具,但按 Token 收费的模式让很多开发者"又爱又恨"。本文从基础用法到成本控制,用幽默风趣的方式教你如何高效使用 Claude Code,既提高效率又控制成本。


Continue reading