Karpathy 的本地 AI 知识库，和我的实践

Karpathy 分享了他如何构建本地的 AI 知识库，跟我用的方法也很相似。

都是用的 Obsidian，纯本地 MD，然后用一些反向链接、索引的方式把它们连起来。

Karpathy 的方法

他构建了一个用大语言模型驱动的个人 Wiki 知识库，然后把原始资料都丢进一个叫 RAW 的目录。

然后让大语言模型把这些原始资料编译成一个 Markdown Wiki，实现以下功能：自动创建摘要、创建索引、创建概念条目、添加相互链接、生成可视化等等。

我是在内容收集的时候就已经做好了，用的是 Obsidian 的那个剪藏插件。

在收集内容的时候，AI 就会自动进行以下处理：打标签、自动总结、翻译、创建摘要，目前就是还没有反向链接。

就可以在这个 Wiki 上提问，确保数据来源的可置信度。

比如说大语言模型会自己查索引、读相关的文档，写出回答或者报告，不只是在网页上搜。这样的话，它获取的信息基本上都是跟你相关的。

然后它的输出也尽量不是一句话，而是新的文件、新的可视化网页或者是 PPT，然后再回归到知识库里，让知识库越用越厚。

但这个会造成一个问题，就是 Obsidian 的作者也说了，这会污染知识库。所以最好把可靠性来源和 AI 生成的东西分开放。

还有一个比较好的点是，它会让大模型对 Wiki 做健康度检查。比如：找一些自相矛盾的地方、补发一些缺失的信息、发现一些新的关联、提高一致性。

我也把这套理念放到了 CodePilot 里。

关于助理文件夹的选择，我一般建议使用 Obsidian 文件夹。

如果你有自己的 Obsidian 文件夹，进去以后 AI 就会直接获取你所有的上下文和知识。

这样一来，你直接就能获得一个拥有完整记忆的 AI 助理。

如果你不知道怎么实践的话，推荐用 Codepilot 的助理试试。

把你的 Obsidian 文件夹放进去，让它帮你整理，同时让它把这些原则写到 Claude.md 里面。

参考：@op7418 #how-i-ai#