AI 时代,别只囤笔记:我是怎么把知识库做成一部活的 Wiki

Posted on 三 22 4月 2026 in Tech • Tagged with AI, knowledge-base, wiki, PKM, RAG

AI 很强,但它并不了解你的项目、你的经历和你的判断。真正有用的知识库,不是把笔记堆起来,而是把原始材料、结构化页面、治理规则、来源与校验串成一条流水线。结合我最近折腾的一套私人原型,聊聊我是怎么搭自己的知识库,以及怎样让它不只是一个"仓库"。


Continue reading

CGM 论文讲了什么,咱们又该怎么落地

Posted on 二 21 4月 2026 in Journal • Tagged with CGM, Code Graph, LLM, RAG, SWE-bench, Repository, Ant Group, CodeFuse, 论文笔记

解读 arXiv:2505.16901(Code Graph Model): 这篇论文不是简单地做代码检索,而是把仓库建成一张"文本富图",再把语义和结构一起送进模型。文末给出按投入递增的技术栈与落地路线图。


Continue reading

RRF 倒数排名融合:RAG 里那个看起来土、却一直没被换掉的小公式

Posted on 日 19 4月 2026 in Journal • Tagged with RAG, RRF, Reciprocal Rank Fusion, BM25, Vector Search, Hybrid Search, Reranker, Retrieval

RRF(Reciprocal Rank Fusion)是 RAG 检索里一个长得土、却几乎没人舍得换掉的小公式。不需要训练,不挑分数尺度,一行代码就能把 BM25 和向量检索揉到一起。本文把公式拆开,给一个手算例子,再聊聊它什么时候好用、什么时候该让位给 reranker。


Continue reading

给代码仓库造一个 DeepWiki:Tree-sitter + Embedding + 图谱 + LLM 的方法论

Posted on 四 16 4月 2026 in Journal • Tagged with RAG, Code Knowledge Base, Tree-sitter, Embedding, Memgraph, pgvector, sqlite-vec, LLM, DeepWiki, AI Coding

把一个陌生代码库变成可问可答的 DeepWiki 知识库,靠的不是"把 README 喂给 GPT",而是 Tree-sitter 解析 + Embedding 向量 + 图数据库 + LLM 生成 四件套。本文不谈具体实现代码,只讲方法论、流程与取舍,并进一步讨论:代码作为 source of truth 之后,文档如何分层,以及如何让知识库反过来 harness AI 编码。


Continue reading

Obsidian 加 LLM,个人知识库的正确打开方式

Posted on 三 08 4月 2026 in Journal • Tagged with Obsidian, LLM, 知识管理, AI, MCP, RAG

笔记散落各处,AI 却帮不了你?聊聊怎么用 Obsidian 的本地 Markdown 文件,配合 LLM 插件、MCP 和编译式知识库,把"一堆文件"变成"能回答问题的第二大脑"。


Continue reading

从 RAG 到 GraphRAG:当检索增强生成遇上知识图谱

Posted on 四 26 3月 2026 in tech • Tagged with graphrag, rag, knowledge-graph, llm, ai, leiden, community-detection

传统 RAG 在处理复杂多跳问题时力不从心,GraphRAG 通过引入知识图谱为检索增强生成带来了结构化推理能力。本文从痛点分析、核心架构、Leiden 社区检测算法到工程实践,全面深入剖析 GraphRAG。


Continue reading

用 pgvector 做 RAG:别急着上 Pinecone,你的 PostgreSQL 就够了

Posted on 二 10 3月 2026 in AI • Tagged with RAG, pgvector, PostgreSQL, embedding, vector-search, Python, AI

你刚写完一个 RAG demo,跑通了 OpenAI embedding + Pinecone,兴奋了三秒——然后老板问你:"这个月 Pinecone 账单多少?"于是你开始重新审视那台已经跑了三年的 PostgreSQL。好消息:装个 pgvector 扩展,它就是你的向量数据库。这篇文章给你一套从 Docker 部署到 Python 完整代码的实操指南,跑完就能用。


Continue reading

如何打造个人与项目知识库:从全文搜索到 RAG,再到 Claude Skill

Posted on 四 05 2月 2026 in AI • Tagged with 知识库, 全文搜索, RAG, Claude-Code, Cursor, 写作方法

很多人一上来就要“搞 RAG”,结果三天后变成“搞不下去”。真正能跑起来的知识库,往往从最土的全文搜索开始:先能找、再能用、最后才谈自动化。本文给一条可落地的路线:全文搜索 → 轻量 RAG → 把流程封装成 Claude Skill / Cursor command。


Continue reading

Prompt 工程已死,上下文工程当立

Posted on 五 16 1月 2026 in AI • Tagged with context-engineering, RAG, Personal Knowledge Base, LLM, AI-agent

你的 AI 回答总是不着边际?别再死磕 Prompt 了,多半是"上下文"没给对。本文深度解读"上下文工程",剖析它与 RAG 的本质区别,并通过一个"AI 面试官"的完整实例,手把手教你打造一个不弱智的 Agent。


Continue reading

RAG 进阶指南:别只盯着向量数据库,Elasticsearch 才是扫地僧

Posted on 四 15 1月 2026 in AI • Tagged with RAG, Elasticsearch, Vector Search, LLM, Hybrid Search

你的 RAG 系统总是在胡说八道?多半是检索拖了后腿。本文基于 Medium 高赞文章,深度解析如何利用 Elasticsearch 的混合检索、函数得分等高级特性,拯救你那“弱不禁风”的 RAG。


Continue reading