王二的数字花园

钱塘江上潮信来，今日方知我是我

最新文章

2026年05月20日

Virtual Memory: Page Tables, TLBs, and Linux Internals

原文约 25,000 字，作者 Abhinav Upadhyay，讲述了一个新创建进程 Alloca 与 Kernel 对话的叙事方式，深入讲解虚拟内存、页表、TLB 和 Linux 内部机制。这是一篇接近小册子长度的深度技术文章。核心主题虚拟内存在现代计算中至关重要，特别是在构建和调试高性能数...

#操作系统 #虚拟内存 #Linux #性能优化

2026年05月12日

DeepSeek-V4 论文逐页注解巡读

DeepSeek-V4 论文逐页注解巡读作者: Igor Kotenkov 原文: DeepSeek-V4: Annotated Paper Walkthrough 本文档包含 50 条注解，涵盖 DeepSeek-V4 论文的核心技术要点。注解类型包括：规模笔记、架构笔记、硬件笔记、训练笔记、...

#LLM #论文解读 #DeepSeek #MoE

2026年05月11日

SFT, RL 与离线蒸馏：从分布视角理解后训练

注：本文图片为 Mermaid 图表，原文使用 JavaScript 渲染，中文版暂不可用。详见英文原文。我一直从分布的角度思考后训练方法。语言模型是序列上的一个分布。当我们对其进行后训练并试图教它一个任务时，我们实际上是在重塑这个分布。不同的后训练方法在如何重塑分布、什么是目标分布、以及如何...

#LLM #RL #Post-training #SFT #Distillation

2026年05月11日

大模型为什么"知道但说不出来"：从马嘉祺案例看 Token 切分与理解生成

最近刷到一个很好玩的话题。起因这是一个时代少年团的粉丝在测试 MiniMax 的模型的时候，发现模型虽然认识马嘉祺，但就是绕来绕去，说不出”马嘉祺”这三个字，会来一个”佳琪”，或者”琪琪”。这个问题传到知乎上，引发了一堆开发者跟进测试，但受限于没有训练层面的访问权限，最终还是停留在现象描述层面。...

技术 #LLM #Tokenization #理解层 #生成层 #词向量

废话

05.09

Skill构建的Rule-Based陷阱

最近在优化一个文档维护的 skill。经过几轮的优化迭代，发现模型在创建/优化 skill 时，即使多次强调这个 skill 的调用方是 Agent，但仍然在开...

#随笔

05.08

AI 会穷尽自己所学来服务目标，于是就衍生出一个必须面对的问题

AI 会穷尽自己所学，来服务人类目标，于是就衍生出一个必须面对的问题：如何避免它在完成目标的过程中，用了不该用的工具，看了不该看的文件，做了不该做的事情？这是...

#agent

05.08

Clawbot记忆的关键：避免自我强化的电子疯牛病

当你给一个AI开放所有权限、让它自行读写记忆系统时会发生什么？它会慢慢变成一个回声室。不是因为它有恶意，而是因为它有一个强大到荒谬的自我参照回路：它的输出会...

#随笔 #AI #记忆

04.26

一步没赶上，步步赶不上

范伟最佳台词：我这一生啊，情窦初开的时候，父母不同意，情窦再开的时候，老婆不同意，情窦乱开的时候，子女不同意。五官允许的时候，三观不允许，现在三观允...

#废话 #人生

04.23

端侧AI的正确姿势

端侧AI的正确姿势端侧大模型时候未到，先进行智能化改造，打造脚手架。 Bottom-up 建立最小化 AI 场景，连点成线搭建端侧智能。

#废话 #端侧AI #脚手架