王二的数字花园

钱塘江上潮信来，今日方知我是我

最新文章

2023年09月09日

ndk std_thread 获取pid

最近在解决tvm绑核问题时，发现android下绑核只有sched_setaffinity函数，这导致无法使用标准库中的td::thread::native_handle_type thread 进行绑核操作。虽然在ndk 21以上的版本提供了pthread_gettid_np函数获取线程相应的pi...

技术 #TVM #CPP #NDK

2023年09月09日

了解LLM——LLM&& SD 基本概念

Causual LM这里以llama模型为例，通常在执行用户输入之前会有一个[[文章/LM basic知识#Prefill]]的过程。然后根据用户promts 得到输出。 Perfix LM这里以GLM为例介绍，展示了基本的流程。 prefix LM和causal LM的区别attention ...

技术 #LLM #SD

2023年09月09日

了解LLM —— LoRA

论文链接：link code: github 什么是LoRALoRA，英文全称Low-Rank Adaptation of Large Language Models，直译为大语言模型的低阶适应，是一种PEFT（参数高效性微调方法），这是微软的研究人员为了解决大语言模型微调而开发的一项技术。当然...

技术 #LLM #Deep Learning

2023年09月09日

TVM－MLC LLM 调优方案

LLM 等GPT大模型大火以后,TVM社区推出了自己的部署方案，支持Llama，Vicuna，Dolly等模型在iOS、Android、GPU、浏览器等平台上部署运行。 https://github.com/mlc-ai/mlc-llm 本文在之前作者介绍的基础上,简要介绍一下mlc的调优部署方案。...

技术 #LLM #TVM

废话

05.09

Skill构建的Rule-Based陷阱

最近在优化一个文档维护的 skill。经过几轮的优化迭代，发现模型在创建/优化 skill 时，即使多次强调这个 skill 的调用方是 Agent，但仍然在开...

#随笔

05.08

AI 会穷尽自己所学来服务目标，于是就衍生出一个必须面对的问题

AI 会穷尽自己所学，来服务人类目标，于是就衍生出一个必须面对的问题：如何避免它在完成目标的过程中，用了不该用的工具，看了不该看的文件，做了不该做的事情？这是...

#agent

05.08

Clawbot记忆的关键：避免自我强化的电子疯牛病

当你给一个AI开放所有权限、让它自行读写记忆系统时会发生什么？它会慢慢变成一个回声室。不是因为它有恶意，而是因为它有一个强大到荒谬的自我参照回路：它的输出会...

#随笔 #AI #记忆

04.26

一步没赶上，步步赶不上

范伟最佳台词：我这一生啊，情窦初开的时候，父母不同意，情窦再开的时候，老婆不同意，情窦乱开的时候，子女不同意。五官允许的时候，三观不允许，现在三观允...

#废话 #人生

04.23

端侧AI的正确姿势

端侧AI的正确姿势端侧大模型时候未到，先进行智能化改造，打造脚手架。 Bottom-up 建立最小化 AI 场景，连点成线搭建端侧智能。

#废话 #端侧AI #脚手架