给 Cursor、Codex、Claude Code 用的 AI Skill,到底该怎么测

Posted on 一 20 4月 2026 in Journal • Tagged with AI, Agent Skills, Cursor, Claude Code, Codex, Testing, Evaluation, CI

上一篇讲过用 promptfoo 测 LLM API 类的 AI skill。可咱们日常写的更多是另一种——给 Cursor、Codex、Claude Code 用的本地 skill,它没有 endpoint,没有固定 prompt,调用方是另一个 agent。这种 skill 该怎么测?本文给一套从结构 lint 到行为回归的完整方案。


Continue reading

RRF 倒数排名融合:RAG 里那个看起来土、却一直没被换掉的小公式

Posted on 日 19 4月 2026 in Journal • Tagged with RAG, RRF, Reciprocal Rank Fusion, BM25, Vector Search, Hybrid Search, Reranker, Retrieval

RRF(Reciprocal Rank Fusion)是 RAG 检索里一个长得土、却几乎没人舍得换掉的小公式。不需要训练,不挑分数尺度,一行代码就能把 BM25 和向量检索揉到一起。本文把公式拆开,给一个手算例子,再聊聊它什么时候好用、什么时候该让位给 reranker。


Continue reading

给代码仓库造一个 DeepWiki:Tree-sitter + Embedding + 图谱 + LLM 的方法论

Posted on 四 16 4月 2026 in Journal • Tagged with RAG, Code Knowledge Base, Tree-sitter, Embedding, Memgraph, pgvector, sqlite-vec, LLM, DeepWiki, AI Coding

把一个陌生代码库变成可问可答的 DeepWiki 知识库,靠的不是"把 README 喂给 GPT",而是 Tree-sitter 解析 + Embedding 向量 + 图数据库 + LLM 生成 四件套。本文不谈具体实现代码,只讲方法论、流程与取舍,并进一步讨论:代码作为 source of truth 之后,文档如何分层,以及如何让知识库反过来 harness AI 编码。


Continue reading

用 Promptfoo 给 AI skill 做体检:评估、测试、质量与安全把关

Posted on 三 15 4月 2026 in Journal • Tagged with Promptfoo, AI, LLM, Agent, Skill, Evaluation, Red Team, Security, CI/CD

很多团队做 AI skill,还停留在“这次跑通了,看起来不错”的阶段。可真正上线之后,问题往往不在第一次回答,而在波动、成本、工具调用路径和安全边界。本文借 Promptfoo 这把尺子,聊聊怎么系统地评估、测试并给 AI skill 做质量与安全把关。


Continue reading

在 Kubernetes 里用 cert-manager + Venafi 自动签发和轮换证书

Posted on 三 15 4月 2026 in Journal • Tagged with Kubernetes, cert-manager, Venafi, TLS, certificate, security, DevOps

很多团队把 TLS 证书当成一次性配置,直到某个周五晚上证书快过期了,才想起这件事不能靠日历提醒。本文以 Kubernetes 服务为例,讲清楚怎么把 cert-manager 当执行层,把 Venafi 当策略和 CA 门卫,做到声明式签发、自动续期、私钥轮转,以及应用侧平滑 reload。


Continue reading

Obsidian 加 LLM,个人知识库的正确打开方式

Posted on 三 08 4月 2026 in Journal • Tagged with Obsidian, LLM, 知识管理, AI, MCP, RAG

笔记散落各处,AI 却帮不了你?聊聊怎么用 Obsidian 的本地 Markdown 文件,配合 LLM 插件、MCP 和编译式知识库,把"一堆文件"变成"能回答问题的第二大脑"。


Continue reading

Gevent 是什么,和 asyncio 一起用有什么坑

Posted on 二 07 4月 2026 in Journal • Tagged with Python, Flask, Gevent, asyncio, 并发

从 Flask 老项目里的聚合接口说起,聊聊 gevent 和 asyncio 到底差在哪里,各自适合什么场景,又各有哪些坑。


Continue reading

证书这活儿:PEM/JKS/P12 怎么选、免费证书哪家强、自动轮换怎么搞

Posted on 二 24 3月 2026 in Journal • Tagged with certificate, TLS, SSL, PEM, JKS, PKCS12, Let's Encrypt, cert-manager, security, DevOps

以我自己的个人网站证书过期为引子,讲清楚 Root CA、Intermediate CA、Leaf Certificate 的职责、格式与验证过程,再把 PEM/JKS/P12 的选择和自动轮换这件事说透。


Continue reading

AI Agent Loop 讲透:以一个会自己写博客的 Python Demo 为例

Posted on 四 19 3月 2026 in Journal • Tagged with agent, agent-loop, AI, LLM, python, tool-calling, memory, planning

以 lazy-rabbit-agent 里的 agent_loop_demo.py 为例,讲清楚 AI Agent Loop 的本质:它不是玄学,而是由规划、记忆、工具调用、观察回流、格式约束与失败恢复组成的一台小发动机。


Continue reading

演讲的认知科学:别再浪费彼此的时间了

Posted on 四 19 3月 2026 in Journal • Tagged with 演讲, 演示, 认知科学, 沟通, 方法论, presentation

你精心准备了 40 页 PPT,讲了 45 分钟,台下却只记住了你那句"下一页"。问题不在你的内容不好,而在你忽视了一件事:人脑不是硬盘,它有带宽限制、有注意力衰减曲线、有情绪开关。本文从认知科学的角度,拆解演讲中"听懂"这件事的底层逻辑,给你一套可落地的演讲清单。


Continue reading

Workload Identity:别再把云上身份塞进 Secret 里了

Posted on 四 19 3月 2026 in Journal • Tagged with journal, blog, security, cloud, kubernetes, iam, workload identity

讲清楚 workload identity 是什么、为什么它比长期凭证更靠谱,以及在 Kubernetes 和云平台里如何落地。


Continue reading

职场工具箱之 Radical Candor:怎样既不当老好人,也不当刺头?

Posted on 二 17 3月 2026 in Journal • Tagged with 职场工具箱, Radical Candor, 反馈, 管理, 沟通, 方法论

你要么什么都不说(老好人),要么一开口就得罪人(刺头)。Radical Candor(彻底坦诚)告诉你:好的反馈 = 关心对方 + 直接挑战。两个维度画出四个象限:彻底坦诚、恶意攻击、虚伪客套、过度同情。本文教你怎么在"关心"和"直接"之间找到那个甜蜜点。


Continue reading

职场工具箱之利益-立场拆分:为什么"我不同意"背后可能是同一目标?

Posted on 一 16 3月 2026 in Journal • Tagged with 职场工具箱, 利益, 立场, 谈判, 沟通, 方法论

你和同事吵了半小时"用 Redis 还是用 Kafka",最后发现你们其实都想解决同一个问题——消息不丢。立场是"我要什么",利益是"我为什么要"。大多数职场冲突不是利益冲突,而是立场冲突。学会拆分利益和立场,你会发现 80% 的"不同意"其实可以变成"换个方式都同意"。


Continue reading

职场工具箱之 RICE / ICE:如何把优先级从"拍脑袋"变成"可讨论"?

Posted on 一 09 3月 2026 in Journal • Tagged with 职场工具箱, RICE, ICE, 优先级, 需求管理, 方法论

每次排优先级,最后都变成"谁嗓门大谁赢"。RICE 和 ICE 是两个把优先级"数字化"的评分模型——不是为了算出"唯一正确答案",而是让讨论从"我觉得"变成"我们来看看分数"。本文教你怎么用、什么时候用哪个、以及怎么避免"用公式掩盖拍脑袋"。


Continue reading

职场工具箱之 OKR:为什么"很努力"≠"有产出"?

Posted on 六 07 3月 2026 in Journal • Tagged with 职场工具箱, OKR, 目标管理, 绩效, 方法论

你每天加班到九点,季度末却说不出自己做了什么有价值的事——不是你不努力,是你的目标从一开始就没对齐。OKR 不是 KPI 的马甲,它是一套"把努力翻译成产出"的对齐工具。本文用三个真实场景教你怎么写、怎么对齐、怎么复盘。


Continue reading

服务稳定性之 LMAT 和 USED:别等着报警, 先学会"看病历"

Posted on 五 06 3月 2026 in Journal • Tagged with journal, sre, observability, reliability, LMAT, USED

LMAT 是观测的四件套(Log/Metrics/Alert/Trace), USED 是系统体检的四个指标(Usage/Saturation/Error/Delay)。一个管"看见", 一个管"看懂"。把这两套方法配起来, 稳定性工作才不至于变成“救火队日常”。


Continue reading

职场工具箱之向上管理:不是拍马屁,而是帮领导做决策更容易

Posted on 三 25 2月 2026 in Journal • Tagged with 职场工具箱, 向上管理, 沟通, 汇报, 决策

真正的向上管理不是“会说话”,而是把坏消息说清楚、把选项摆出来、把代价算明白,让领导更容易做出对团队有利的决策。


Continue reading

Operator + Terraform 对传统运维的改变

Posted on 五 23 1月 2026 in Journal • Tagged with journal, blog

| Abstract | Journal on 2026-01-23 | | --------------|------------------------| | Authors | Walter Fan | | Category  | learning note  | | St...


Continue reading

职场中那些“活得最久”的方法论缩写

Posted on 日 11 1月 2026 in Journal • Tagged with journal, blog

| Abstract | Journal on 2026-01-11 | | --------------|------------------------| | Authors | Walter Fan | | Category  | learning note  | | St...


Continue reading

最通用的 6 大演讲框架

Posted on 一 05 1月 2026 in Journal • Tagged with journal, blog

| Abstract | Journal on 2026-01-05 | | --------------|------------------------| | Authors | Walter Fan | | Category  | learning note  | | St...


Continue reading