4万美金的H100都在等磁盘IO——Agent的真实瓶颈根本不是推理
原文链接:知乎 - Guanlan 作者:Guanlan,Runta 创始人CEO,打造 Agent 原生 Infra 🔑 存储IO瓶颈要点总结这篇文章来自 ASPLOS 2026 的 AgenticOS Workshop,核心发现令人震惊: LLM 推理时间只占端到端延迟的 30%~40%...
原文链接:知乎 - Guanlan 作者:Guanlan,Runta 创始人CEO,打造 Agent 原生 Infra 🔑 存储IO瓶颈要点总结这篇文章来自 ASPLOS 2026 的 AgenticOS Workshop,核心发现令人震惊: LLM 推理时间只占端到端延迟的 30%~40%...
翟东升:位置决定收入,天赋决定上限关于收入与阶层你知道你这辈子能挣到多少钱?这是一个残酷的世界——80亿人的金字塔,你处在这个金字塔的什么位置,就是你在整个社会残酷的分层中间在什么岗位。你能挣到的钱以及你能留住的钱,跟这个有关。 富人的消费与总需求今天整个世界面临的一个核心矛盾,就是富人他所有的欲望...
原文链接:顶会FAST’26解读|ZUFS:旗舰手机的下一代存储革命 来源:存储随笔 当我们讨论旗舰手机的性能时,目光往往聚焦于SoC、内存、屏幕,却常常忽略了一个决定整机体验下限的核心组件——存储。从2017年UFS 2.0到2024年UFS 4.0,手机连续读取带宽从几百MB/s飙升到4.2...
Karpathy 分享了他如何构建本地的 AI 知识库,跟我用的方法也很相似。 都是用的 Obsidian,纯本地 MD,然后用一些反向链接、索引的方式把它们连起来。 Karpathy 的方法他构建了一个用大语言模型驱动的个人 Wiki 知识库,然后把原始资料都丢进一个叫 RAW 的目录。 然后让大...