王二的数字花园

钱塘江上潮信来,今日方知我是我

最新文章

Nivdia向量数据库图检索最新标杆——CAGRA

CAGRA 是 N社在RAFT项目中 最新的 ANN 向量索引。这是一种高性能的、 GPU 加速的、基于图的方法,尤其是针对小批量情况进行了优化,其中每次查找只包含一个或几个查询向量。 与其他像HNSW、SONG等这类基于图的方法相似,CAGRA在索引训练阶段构建了一个经过优化的 k-最近邻(k-N...

RAG系统构建_技术文档中句子嵌入的挑战

这个是爱立信对RAG pipeline中 retrival阶段的一个实验报告。并得到的一些初步的实验结论。 sentence embedding 计算的相似度随着文本切分长度增加逐渐变得不可信。 他们选取了 10,970条句子,计算了相互之间的余弦相似度。最终形成了下面的Kernel Densit...

Bi-encoder vs Cross encoder? When to use which one?

Bi-encoder和Cross-encoder是在自然语言理解任务模型的两种不同方法,在信息检索和相似性搜索二者的使用更为广泛。在LLM大火的今天,RAG的pipe line中这两个模块作为提升检索精度的模块更是备受瞩目。 Bi-encoder Cross-encoder 架构...

废话

Skill构建的Rule-Based陷阱

最近在优化一个文档维护的 skill。经过几轮的优化迭代,发现模型在创建/优化 skill 时,即使多次强调这个 skill 的调用方是 Agent,但仍然在开...

#随笔

AI 会穷尽自己所学来服务目标,于是就衍生出一个必须面对的问题

AI 会穷尽自己所学,来服务人类目标,于是就衍生出一个必须面对的问题:如何避免它在完成目标的过程中,用了不该用的工具,看了不该看的文件,做了不该做的事情? 这是...

#agent

Clawbot记忆的关键:避免自我强化的电子疯牛病

当你给一个AI开放所有权限、让它自行读写记忆系统时会发生什么? 它会慢慢变成一个回声室。 不是因为它有恶意,而是因为它有一个强大到荒谬的自我参照回路:它的输出会...

#随笔 #AI #记忆

一步没赶上,步步赶不上

范伟最佳台词: 我这一生啊, 情窦初开的时候,父母不同意, 情窦再开的时候,老婆不同意, 情窦乱开的时候,子女不同意。 五官允许的时候,三观不允许, 现在三观允...

#废话 #人生

端侧AI的正确姿势

端侧AI的正确姿势端侧大模型时候未到,先进行智能化改造,打造脚手架。 Bottom-up 建立最小化 AI 场景,连点成线搭建端侧智能。

#废话 #端侧AI #脚手架