归档
共 72 篇文章
2026
- mermaid图表测试
- Qwen3.5 Gated DeltaNet 核心机制解析
- Qwen3.5 核心架构解析:Gated DeltaNet 线性注意力机制
- 4万美金的H100都在等磁盘IO——Agent的真实瓶颈根本不是推理
- 翟东升 - 位置决定收入,天赋决定上限
- 顶会FAST'26解读|ZUFS:旗舰手机的下一代存储革命
- Karpathy 的本地 AI 知识库,和我的实践
- Subagent 卡死排查:input tokens 的隐形天花板
- KK谈AI与裁员:惊喜才刚刚开始
- 推理LLM的强化学习现状 技术翻译
- GB200 NVL72 + GLM-5-FP8 成本深度拆解:从硬件折旧到每百万 Token 只需 38 元 技术分析
- 从微博热议到数据拆解:华为Mate 80系列的芯片良率之谜 产业观察
- 时间资产:比钱更狠的阶级分化,AI正在加速 随笔
- Heuristics 黄昏,Mechanism 迷途 随笔
- ContextPilot:基于上下文复用的长上下文推理加速方案 技术分析 论文解读
- 数学公式渲染测试 测试
- 一次有趣的 Bug 排查:桌面端深色模式切换失效 技术笔记
- 个人博客开发总结 - 从零到上线 技术笔记
2024
- 人口、自动化与权力:我们正滑向哪种未来? 随笔
- SSD笔记 - 第六篇 结论 转载
- SSD笔记 - 第五篇 access pattern, 系统配置 转载
- SSD笔记 - 第四篇 FTL 其他功能及平行机制 转载
- ssd_notes_03 转载
- SSD笔记-第二篇SSD结构与性能评估概述 转载
- SSD笔记- 第一篇引言 转载
- fp16 的累加误差有多大 技术
- cuda_mode_1 技术
- 端侧 LLM 的PD分离技术之稀疏性 技术
- Nvidia 的快速反量化操作 技术
- Turbo Sparse paper
- kimi 长上下文 case 记录
- Nivdia向量数据库图检索最新标杆——CAGRA 技术
- RAG系统构建_技术文档中句子嵌入的挑战 技术
- Bi-encoder vs Cross encoder? When to use which one? 技术
- 【转载】一种编译期Map的实现 转载
- 【转载】爬虫如何通过二维码登录知乎 转载
- TK 学习法 闲聊
- 国内环境配置pyppeteer python
2023
- MLX 框架浅析 竞分
- 从向量数据库到 ANN search 技术
- L1 data 缓存为什么一般只有32K或者64K 技术
- ndk std_thread 获取pid 技术
- 了解LLM——LLM&& SD 基本概念 技术
- 了解LLM —— LoRA 技术
- TVM-MLC LLM 调优方案 技术
- TVM 源码阅读PASS — VectorizeLoop 技术
- SVE特性以及寄存器
- tir_to_llvm_ir
- Linux_shell中提取文件名和路径
- packfunc
- 【TVM教程】 自定义relay算子 技术
- 【TVM模型编译】2. relay算子构造 技术
- 【tvm解析】3. Operator Strategy 机制 技术
- tvm-多线程代码生成和运行 技术
- C++'s most vexing parse 技术
- 【TVM模型编译】1. onnx2relay 技术
- 【TVM模型编译】0.onnx模型优化流程.md 技术
- 利用 Github Actions 自动部署 Hexo 博客
2021
- C++初始化列表 技术
2019
- 初始化方法-基本到kaiming 技术
- 链表反转
- 柔性数组 技术
- c++构造函数 技术