从传统 Wiki 到 AI 增强知识库

Posted on 五 29 5月 2026 in Tech • Tagged with LLM, Wiki, knowledge-base, RAG, AI, documentation, knowledge-management

我自己用 SQLite 写了一个传统 Wiki,链接靠手动维护。读了 llm_wiki 项目后,我没有推倒重来,而是决定吸收其精华,用 Python 写一个小工具来渐进增强。AI 是工人、咨询师、秘书,人才是知识库的主人。


Continue reading

让 AI 如你如愿:从 Harness Engineering 说起

Posted on 二 12 5月 2026 in AI • Tagged with AI, LLM, coding-agent, harness-engineering, agent, software-engineering

Martin Fowler 的《Harness engineering for coding agent users》提醒我们,想让 coding agent 少添乱、多干活,光靠更大的模型还不够,还要把模型外面的规则、工具、反馈和验证系统搭起来。AI 工程化正在从 prompt 技巧,走向 harness engineering。


Continue reading

AI 不只是 LLM 和 NLP

Posted on 一 11 5月 2026 in AI • Tagged with AI, LLM, NLP, computer-vision, reinforcement-learning, recommendation, robotics, machine-learning

这两年"AI"几乎成了 LLM 的代名词,一聊 AI 就是 ChatGPT、Claude、提示词工程,仿佛 AI 就等于聊天机器人。作为一个在多个领域做过工程落地的老工程师,我想说:这个认知框架太窄了——AI 是一个庞大的技术生态,LLM 只是其中一个(虽然眼下最耀眼的)分支。


Continue reading

LLM API 越来越贵,别让 token 像自来水一样哗哗流

Posted on 五 08 5月 2026 in Journal • Tagged with LLM, AI, token, cost-control, prompt-engineering, productivity

LLM API 的成本控制不是少用 AI,而是把 token 当工程资源来管。先度量,再分级选模型,压缩上下文,复用缓存,限制输出,离线任务走批处理,最后拿检查清单管住那些看不见的浪费。


Continue reading

RAG 知识库优化:别让 AI 一本正经地胡说八道

Posted on 五 08 5月 2026 in Journal • Tagged with RAG, AI, LLM, 知识库, 向量检索, 最佳实践

RAG 看起来不过是"先检索,再生成",真正做起来才知道坑不少。分块、检索、重排序、Prompt、引用、评估,任何一环偷懒,最后都可能变成一个很自信的胡说八道机器。


Continue reading

从 1:1 Chat 到群聊:让人和多个 AI Agent 一起开会

Posted on 四 30 4月 2026 in Tech • Tagged with AI Agent, Multi-Agent, Group Chat, Conversation Architecture, Human-in-the-loop, LLM

1:1 AI Chat 像请了一个聪明顾问,群聊式 Multi-Agent 则像把产品、架构、安全、测试和人类决策者拉到同一张桌子上。本文讨论如何从单 Agent 对话演进到多人多 Agent 群聊:消息模型、路由策略、Agent 互相对话、上下文隔离、权限治理和最小可用实现。


Continue reading

CGM 论文讲了什么,咱们又该怎么落地

Posted on 二 21 4月 2026 in Journal • Tagged with CGM, Code Graph, LLM, RAG, SWE-bench, Repository, Ant Group, CodeFuse, 论文笔记

解读 arXiv:2505.16901(Code Graph Model): 这篇论文不是简单地做代码检索,而是把仓库建成一张"文本富图",再把语义和结构一起送进模型。文末给出按投入递增的技术栈与落地路线图。


Continue reading

给代码仓库造一个 DeepWiki:Tree-sitter + Embedding + 图谱 + LLM 的方法论

Posted on 四 16 4月 2026 in Journal • Tagged with RAG, Code Knowledge Base, Tree-sitter, Embedding, Memgraph, pgvector, sqlite-vec, LLM, DeepWiki, AI Coding

把一个陌生代码库变成可问可答的 DeepWiki 知识库,靠的不是"把 README 喂给 GPT",而是 Tree-sitter 解析 + Embedding 向量 + 图数据库 + LLM 生成 四件套。本文不谈具体实现代码,只讲方法论、流程与取舍,并进一步讨论:代码作为 source of truth 之后,文档如何分层,以及如何让知识库反过来 harness AI 编码。


Continue reading

用 Promptfoo 给 AI skill 做体检:评估、测试、质量与安全把关

Posted on 三 15 4月 2026 in Journal • Tagged with Promptfoo, AI, LLM, Agent, Skill, Evaluation, Red Team, Security, CI/CD

很多团队做 AI skill,还停留在“这次跑通了,看起来不错”的阶段。可真正上线之后,问题往往不在第一次回答,而在波动、成本、工具调用路径和安全边界。本文借 Promptfoo 这把尺子,聊聊怎么系统地评估、测试并给 AI skill 做质量与安全把关。


Continue reading

Obsidian 加 LLM,个人知识库的正确打开方式

Posted on 三 08 4月 2026 in Journal • Tagged with Obsidian, LLM, 知识管理, AI, MCP, RAG

笔记散落各处,AI 却帮不了你?聊聊怎么用 Obsidian 的本地 Markdown 文件,配合 LLM 插件、MCP 和编译式知识库,把"一堆文件"变成"能回答问题的第二大脑"。


Continue reading

蒸馏:AI 世界里的"吸星大法"

Posted on 日 05 4月 2026 in AI • Tagged with AI, distillation, LLM, agent, skill, knowledge-distillation, DeepSeek, OpenAI

大模型能蒸馏,Agent 的 Skill 也能蒸馏。蒸馏到底是什么?为什么 DeepSeek 能把 671B 的推理能力塞进 1.5B 的小模型?为什么你的 Agent 技能越写越臃肿时,也需要来一轮"蒸馏"?这篇把模型蒸馏和技能蒸馏串起来讲,一次搞懂。


Continue reading

从 RAG 到 GraphRAG:当检索增强生成遇上知识图谱

Posted on 四 26 3月 2026 in tech • Tagged with graphrag, rag, knowledge-graph, llm, ai, leiden, community-detection

传统 RAG 在处理复杂多跳问题时力不从心,GraphRAG 通过引入知识图谱为检索增强生成带来了结构化推理能力。本文从痛点分析、核心架构、Leiden 社区检测算法到工程实践,全面深入剖析 GraphRAG。


Continue reading

再聊 nanobot 的记忆机制:从消息计数到 Token 预算

Posted on 六 21 3月 2026 in AI • Tagged with nanobot, AI Agent, memory, LLM, session management

上次聊了 nanobot 双层记忆的基本设计,这次深入源码,看看它最近的几个关键演进:基于 Token 预算的整理策略、会话历史的合法性校验、以及一个"连续 assistant 消息"的 bug 是怎么产生和修复的。


Continue reading

AI Agent Loop 讲透:以一个会自己写博客的 Python Demo 为例

Posted on 四 19 3月 2026 in Journal • Tagged with agent, agent-loop, AI, LLM, python, tool-calling, memory, planning

以 lazy-rabbit-agent 里的 agent_loop_demo.py 为例,讲清楚 AI Agent Loop 的本质:它不是玄学,而是由规划、记忆、工具调用、观察回流、格式约束与失败恢复组成的一台小发动机。


Continue reading

nanobot 的记忆机制:它为什么能记住你的习惯和喜好?

Posted on 日 15 3月 2026 in AI • Tagged with nanobot, AI Agent, memory, LLM

拆解 nanobot 的双层记忆系统——一个只有 4000 行代码的 AI 助手,是怎么做到跨会话记住你的偏好、项目上下文和工作习惯的?从源码到设计哲学,聊聊 AI Agent 的"长期记忆"该怎么做。


Continue reading

Claude 提示工程最佳实践:从"能用"到"好用"的距离,可能就差一个系统提示词

Posted on 四 05 3月 2026 in AI • Tagged with AI, prompt-engineering, Claude, LLM, 提示工程, Anthropic

大多数人用 Claude 就像用搜索引擎——丢一句话进去,看看出来什么。但 Claude 4.6 已经不是一个"问答机器"了,它更像一个刚入职的天才实习生:聪明得吓人,但完全不知道你们组的规矩。这篇文章拆解 Anthropic 官方最新的提示工程指南,把那些"看起来都懂、做起来全忘"的技巧变成你明天就能用的 checklist。


Continue reading

设计一个学习职场英语的 AI Agent(LLM Agent 架构 + 日常闭环 + 打分)

Posted on 一 23 2月 2026 in Tech • Tagged with ai-agent, llm, agents, learning, spaced-repetition, english

一份纯技术向的设计:用 LLM-powered agent 跑一个固定的日常学习闭环(morning learn → evening test → next-day review),并用双维度打分管理句子库:实用度(1–5)与熟练度(1–5)。


Continue reading

Prompt 工程已死,上下文工程当立

Posted on 五 16 1月 2026 in AI • Tagged with context-engineering, RAG, Personal Knowledge Base, LLM, AI-agent

你的 AI 回答总是不着边际?别再死磕 Prompt 了,多半是"上下文"没给对。本文深度解读"上下文工程",剖析它与 RAG 的本质区别,并通过一个"AI 面试官"的完整实例,手把手教你打造一个不弱智的 Agent。


Continue reading

从 PDCA 到 PAOE:AI Agent 大脑里的循环

Posted on 四 15 1月 2026 in AI • Tagged with AI-agent, ReAct, LLM, PDCA, architecture

PDCA 是管理者的圣经,但对于 AI Agent 来说,它太慢了。本文提出 PAOE (Plan, Act, Observe, Evaluate) 模型,深度解析 ReAct 机制如何让 LLM 拥有“手眼协调”的能力,并附带 Python 实现代码。


Continue reading

RAG 进阶指南:别只盯着向量数据库,Elasticsearch 才是扫地僧

Posted on 四 15 1月 2026 in AI • Tagged with RAG, Elasticsearch, Vector Search, LLM, Hybrid Search

你的 RAG 系统总是在胡说八道?多半是检索拖了后腿。本文基于 Medium 高赞文章,深度解析如何利用 Elasticsearch 的混合检索、函数得分等高级特性,拯救你那“弱不禁风”的 RAG。


Continue reading