用 Promptfoo 给 AI skill 做体检:评估、测试、质量与安全把关

Posted on 三 15 4月 2026 in Journal • Tagged with Promptfoo, AI, LLM, Agent, Skill, Evaluation, Red Team, Security, CI/CD

很多团队做 AI skill,还停留在“这次跑通了,看起来不错”的阶段。可真正上线之后,问题往往不在第一次回答,而在波动、成本、工具调用路径和安全边界。本文借 Promptfoo 这把尺子,聊聊怎么系统地评估、测试并给 AI skill 做质量与安全把关。


Continue reading

AI Agent 会越来越像人吗?从 Tool、Skill、Memory 到 Soul 和 Rules

Posted on 日 05 4月 2026 in AI • Tagged with AI, agent, memory, skills, rules, MCP, multi-agent, governance, multimodal

AI Agent 的演化,表面上看越来越拟人,技术上看其实是在一层层补齐“器官”:从思考与推理、多模态感知,到工具、技能、记忆、人格、规则、身体接口,再到多 Agent 协作与治理。它未必先替代人,但一定会先重写很多知识工作的分工边界。


Continue reading

蒸馏:AI 世界里的"吸星大法"

Posted on 日 05 4月 2026 in AI • Tagged with AI, distillation, LLM, agent, skill, knowledge-distillation, DeepSeek, OpenAI

大模型能蒸馏,Agent 的 Skill 也能蒸馏。蒸馏到底是什么?为什么 DeepSeek 能把 671B 的推理能力塞进 1.5B 的小模型?为什么你的 Agent 技能越写越臃肿时,也需要来一轮"蒸馏"?这篇把模型蒸馏和技能蒸馏串起来讲,一次搞懂。


Continue reading

AI Agent 为什么会越用越懂你?从 OpenClaw 的“养龙虾”聊起

Posted on 三 01 4月 2026 in AI • Tagged with AI, agent, OpenClaw, memory, personalization, context-engineering

很多人觉得 OpenClaw 这类 AI Agent 用久了会“自我进化”。真相没那么玄:多数时候,不是模型偷偷变聪明了,而是记忆、偏好画像、工具调用、反馈回路和工作流沉淀一起把它越养越顺手。


Continue reading

AI Agent Loop 讲透:以一个会自己写博客的 Python Demo 为例

Posted on 四 19 3月 2026 in Journal • Tagged with agent, agent-loop, AI, LLM, python, tool-calling, memory, planning

以 lazy-rabbit-agent 里的 agent_loop_demo.py 为例,讲清楚 AI Agent Loop 的本质:它不是玄学,而是由规划、记忆、工具调用、观察回流、格式约束与失败恢复组成的一台小发动机。


Continue reading

如何写好一个 AI Skill:让 AI Agent 从"什么都会"变成"真的能干活"

Posted on 二 17 3月 2026 in Tech • Tagged with AI, Skill, Agent, Prompt Engineering, Claude Code, Cursor, 方法论

AI Agent 就像你新招的天才实习生——什么都学过,但到了你的项目里,连 CI 怎么跑都不知道。AI Skill 就是那份"入职培训手册",把你的领域知识、工作流程、最佳实践打包成 AI 能理解和执行的模块。本文拆解写好 AI Skill 的方法、原则、示例和自检清单。


Continue reading