4万美金的H100都在等磁盘IO——Agent的真实瓶颈根本不是推理
原文链接:知乎 - Guanlan 作者:Guanlan,Runta 创始人CEO,打造 Agent 原生 Infra 🔑 存储IO瓶颈要点总结这篇文章来自 ASPLOS 2026 的 AgenticOS Workshop,核心发现令人震惊: LLM 推理时间只占端到端延迟的 30%~40%...
原文链接:知乎 - Guanlan 作者:Guanlan,Runta 创始人CEO,打造 Agent 原生 Infra 🔑 存储IO瓶颈要点总结这篇文章来自 ASPLOS 2026 的 AgenticOS Workshop,核心发现令人震惊: LLM 推理时间只占端到端延迟的 30%~40%...
原文链接:顶会FAST’26解读|ZUFS:旗舰手机的下一代存储革命 来源:存储随笔 当我们讨论旗舰手机的性能时,目光往往聚焦于SoC、内存、屏幕,却常常忽略了一个决定整机体验下限的核心组件——存储。从2017年UFS 2.0到2024年UFS 4.0,手机连续读取带宽从几百MB/s飙升到4.2...
前情提要第六篇,这篇就是把五篇的重点做个摘录。 基礎 SSD(solid state drive) 是基于 flash NAND memory 制作的储存装置。资料(Bits)储存在不同种类的 cell 里,当时有 SLC, MLC, TLC,分别代表一个 cell 里面可存 1, 2, 3 个 b...
前情提要作者在介绍了 SSD 内部运作原理后,为何同时 (concurrent) 进行的读写行为会互相干涉,并介绍如何更好的 SSD 读写手法。此篇也涵盖了一部分可改善效能的档案系统最佳化手段。 7 Access Patterns7.1 定义循序及随机 IO 操作Sequential/循序:一个 I...
前情提要在了解 FTL 之后,这里将对 TRIM, over-provisioning 作介绍,并探讨 clustered block 以及 SSD 不同层级的平行机制。 5 Advanced functionalities5.1 TRIM依照 HDD 的慣例,档案系统刪除资料时不一定要真的下抹除指...
前情提要这篇主要介绍 SSD 的读写单位如 page、 block,以及写入放大 (write amplification) 、 wear leveling 等 SSD 问题及设计。除此之外, Flash Translation Layer (FTL) 及其两个主要功能 logical block ...
本文转载自:https://www.owlfox.org/blog/2019-11-25-coding-for-SSD-part-2/ 缘由这篇主要谈论 Nand flash 的不同 cell type,基本的 SSD 系统架构,及如何做 SSD 效能评定(Benchmarking)。作者是在 bo...
本文转载自:https://www.owlfox.org/blog/2019-11-25-coding-for-SSD-part-1/ 缘由Emmanuel Goossaert 是booking.com的工程师,他因为想拿SSD 做自己的 key-value store专案的储存方案,开始学习SSD...