从 PDF Skill 学到什么:把 AI 能力做成可执行流程

Posted on 三 20 5月 2026 in Tech • Tagged with AI, Skills, PDF, Agent Engineering, Automation

一个好的 AI Skill 不只是提示词,而是一套可触发、可分流、可执行、可验证的工作流。本文以 Anthropic 的 PDF skill 为例,拆解它的设计亮点,也指出它在 PDF-to-Markdown 解析上的关键缺口。


Continue reading

AI 时代的事务管理:从"催我自己"到"指挥助理"

Posted on 一 18 5月 2026 in Journal • Tagged with AI, productivity, task-management, GTD, methodology

这两年装了一堆 AI Todo App,可清单越列越长,人却越管越乱。事务管理真正的升级,不在工具,而在把任务从"人脑里的提醒"变成"AI 能读懂的工件",再让 AI 反过来主动驱动你。本文梳理 GTD、四象限、PARA、OKR 在 AI 时代怎么演进,给出 GTD + AI 的五步闭环和"AI 主动驱动"的进阶模式,以及个人和工作事务分别该怎么落地。


Continue reading

Vibe Coding 时代:起码要知道 AI 在做什么

Posted on 六 16 5月 2026 in Tech • Tagged with AI, Vibe Coding, AI Coding, Software Engineering, Harness Engineering

Vibe Coding 可以把编码速度拉满,但开发者不能把判断力也交出去。真正值得练的能力,是从逐行写代码升级为制定规则、绘制蓝图、技术把关和产品监控。


Continue reading

AI 内容洪水来了,人怎样不被淹死

Posted on 四 14 5月 2026 in AI • Tagged with AI, content-quality, human-in-the-loop, harness-engineering, writing

AI 生成内容越来越快,真正的问题不是产能不足,而是人类判断成了瓶颈。解决办法不是让人加班改稿,而是给 AI 内容生产搭一套质量闸门,让人把精力放在方向、判断和定稿上。


Continue reading

给全栈程序员的 Codex 实战手册:别再只会写 Prompt 了

Posted on 四 14 5月 2026 in AI • Tagged with AI, Codex, AGENTS.md, hooks, rules, memories, full-stack, productivity

Codex 真正的生产力,不在于写一条神奇 Prompt,而在于把 AGENTS.md、rules、hooks、memories、skills 和 worktrees 组合成一套可重复、可验证、可演进的工程环境。


Continue reading

让 AI 如你如愿:从 Harness Engineering 说起

Posted on 二 12 5月 2026 in AI • Tagged with AI, LLM, coding-agent, harness-engineering, agent, software-engineering

Martin Fowler 的《Harness engineering for coding agent users》提醒我们,想让 coding agent 少添乱、多干活,光靠更大的模型还不够,还要把模型外面的规则、工具、反馈和验证系统搭起来。AI 工程化正在从 prompt 技巧,走向 harness engineering。


Continue reading

AI 不只是 LLM 和 NLP

Posted on 一 11 5月 2026 in AI • Tagged with AI, LLM, NLP, computer-vision, reinforcement-learning, recommendation, robotics, machine-learning

这两年"AI"几乎成了 LLM 的代名词,一聊 AI 就是 ChatGPT、Claude、提示词工程,仿佛 AI 就等于聊天机器人。作为一个在多个领域做过工程落地的老工程师,我想说:这个认知框架太窄了——AI 是一个庞大的技术生态,LLM 只是其中一个(虽然眼下最耀眼的)分支。


Continue reading

程序员如何看待 AI 取代焦虑

Posted on 日 10 5月 2026 in AI • Tagged with AI, programmer, career, skill-matrix, SWOT, personal-growth

过去几年,Meta、Google、Microsoft、Amazon 等软件和 IT 大公司的裁员消息,把很多程序员的职业安全感打碎了。作为一个写了二十多年代码的老程序员,本文不卖焦虑也不灌鸡汤,只把这团心事拆开看:你怕的到底是什么、AI 拿不走的能力是哪些、像我这样的"全栈老兵"还有没有用武之地,以及怎么用 SWOT、技能矩阵和三圈模型给自己做一次职场体检。


Continue reading

LLM API 越来越贵,别让 token 像自来水一样哗哗流

Posted on 五 08 5月 2026 in Journal • Tagged with LLM, AI, token, cost-control, prompt-engineering, productivity

LLM API 的成本控制不是少用 AI,而是把 token 当工程资源来管。先度量,再分级选模型,压缩上下文,复用缓存,限制输出,离线任务走批处理,最后拿检查清单管住那些看不见的浪费。


Continue reading

RAG 知识库优化:别让 AI 一本正经地胡说八道

Posted on 五 08 5月 2026 in Journal • Tagged with RAG, AI, LLM, 知识库, 向量检索, 最佳实践

RAG 看起来不过是"先检索,再生成",真正做起来才知道坑不少。分块、检索、重排序、Prompt、引用、评估,任何一环偷懒,最后都可能变成一个很自信的胡说八道机器。


Continue reading

AI 编程时代,品味比经验更重要

Posted on 二 05 5月 2026 in Journal • Tagged with AI, programming, engineering, taste, career, methodology

AI 把写代码的门槛拉低了,把判断代码好坏的门槛拉高了。经验不会自动变成优势,反而容易变成包袱。咱们要做的,是用 DDD 守住业务语言,用 ROI 算清楚账,再用品味在多个可行方案里挑那个"长期最少后悔"的。


Continue reading

AI 时代,别只囤笔记:我是怎么把知识库做成一部活的 Wiki

Posted on 三 22 4月 2026 in Tech • Tagged with AI, knowledge-base, wiki, PKM, RAG

AI 很强,但它并不了解你的项目、你的经历和你的判断。真正有用的知识库,不是把笔记堆起来,而是把原始材料、结构化页面、治理规则、来源与校验串成一条流水线。结合我最近折腾的一套私人原型,聊聊我是怎么搭自己的知识库,以及怎样让它不只是一个"仓库"。


Continue reading

给 Cursor、Codex、Claude Code 用的 AI Skill,到底该怎么测

Posted on 一 20 4月 2026 in Journal • Tagged with AI, Agent Skills, Cursor, Claude Code, Codex, Testing, Evaluation, CI

上一篇讲过用 promptfoo 测 LLM API 类的 AI skill。可咱们日常写的更多是另一种——给 Cursor、Codex、Claude Code 用的本地 skill,它没有 endpoint,没有固定 prompt,调用方是另一个 agent。这种 skill 该怎么测?本文给一套从结构 lint 到行为回归的完整方案。


Continue reading

用 Promptfoo 给 AI skill 做体检:评估、测试、质量与安全把关

Posted on 三 15 4月 2026 in Journal • Tagged with Promptfoo, AI, LLM, Agent, Skill, Evaluation, Red Team, Security, CI/CD

很多团队做 AI skill,还停留在“这次跑通了,看起来不错”的阶段。可真正上线之后,问题往往不在第一次回答,而在波动、成本、工具调用路径和安全边界。本文借 Promptfoo 这把尺子,聊聊怎么系统地评估、测试并给 AI skill 做质量与安全把关。


Continue reading

Obsidian 加 LLM,个人知识库的正确打开方式

Posted on 三 08 4月 2026 in Journal • Tagged with Obsidian, LLM, 知识管理, AI, MCP, RAG

笔记散落各处,AI 却帮不了你?聊聊怎么用 Obsidian 的本地 Markdown 文件,配合 LLM 插件、MCP 和编译式知识库,把"一堆文件"变成"能回答问题的第二大脑"。


Continue reading

AI Agent 会越来越像人吗?从 Tool、Skill、Memory 到 Soul 和 Rules

Posted on 日 05 4月 2026 in AI • Tagged with AI, agent, memory, skills, rules, MCP, multi-agent, governance, multimodal

AI Agent 的演化,表面上看越来越拟人,技术上看其实是在一层层补齐“器官”:从思考与推理、多模态感知,到工具、技能、记忆、人格、规则、身体接口,再到多 Agent 协作与治理。它未必先替代人,但一定会先重写很多知识工作的分工边界。


Continue reading

蒸馏:AI 世界里的"吸星大法"

Posted on 日 05 4月 2026 in AI • Tagged with AI, distillation, LLM, agent, skill, knowledge-distillation, DeepSeek, OpenAI

大模型能蒸馏,Agent 的 Skill 也能蒸馏。蒸馏到底是什么?为什么 DeepSeek 能把 671B 的推理能力塞进 1.5B 的小模型?为什么你的 Agent 技能越写越臃肿时,也需要来一轮"蒸馏"?这篇把模型蒸馏和技能蒸馏串起来讲,一次搞懂。


Continue reading

AI Agent 为什么会越用越懂你?从 OpenClaw 的“养龙虾”聊起

Posted on 三 01 4月 2026 in AI • Tagged with AI, agent, OpenClaw, memory, personalization, context-engineering

很多人觉得 OpenClaw 这类 AI Agent 用久了会“自我进化”。真相没那么玄:多数时候,不是模型偷偷变聪明了,而是记忆、偏好画像、工具调用、反馈回路和工作流沉淀一起把它越养越顺手。


Continue reading

从 Prompt Engineering 到 Harness Engineering:AI 编程的四次进化

Posted on 六 28 3月 2026 in Tech • Tagged with harness-engineering, AI, prompt-engineering, context-engineering, Tauri, Rust, Claude Code

OpenAI 用 Codex 在五个月内生成了百万行代码,零行手写。背后的方法论叫 Harness Engineering——不是教 AI 怎么写代码,而是给 AI 搭一个"跑不偏"的环境。本文梳理从 Prompt Engineering 到 Harness Engineering 的四次进化,并用一个实战案例演示:一个不会 Rust 的老程序员,如何靠 Harness Engineering 用 Tauri 写出一个桌面 Todo 应用。


Continue reading

从 RAG 到 GraphRAG:当检索增强生成遇上知识图谱

Posted on 四 26 3月 2026 in tech • Tagged with graphrag, rag, knowledge-graph, llm, ai, leiden, community-detection

传统 RAG 在处理复杂多跳问题时力不从心,GraphRAG 通过引入知识图谱为检索增强生成带来了结构化推理能力。本文从痛点分析、核心架构、Leiden 社区检测算法到工程实践,全面深入剖析 GraphRAG。


Continue reading