王二的数字花园

2023年09月09日

ndk std_thread 获取pid

最近在解决tvm绑核问题时，发现android下绑核只有sched_setaffinity函数，这导致无法使用标准库中的td::thread::native_handle_type thread 进行绑核操作。虽然在ndk 21以上的版本提供了pthread_gettid_np函数获取线程相应的pi...

技术 #TVM #CPP #NDK

2023年09月09日

TVM 源码阅读PASS — VectorizeLoop

VectorizeLoop这个PASS就是对标记为ForKind::kVectorized的For循环做向量化处理，并对For循环中的语句涉及到的变量，替换为Ramp，以便于在Codegen的过程中生成相关的向量化运算的指令。 VectorizeLoop这个PASS的入口函数如下，只有在打开enab...

技术 #TVM #CPP

2023年09月03日

packfunc

为实现多种语言支持，需要满足以下几点：部署：编译结果可以从python/javascript/c++调用。 Debug: 在python中定义一个函数，在编译函数中调用。链接：编写驱动程序以调用设备特定代码（如CUDA），可以在编译的host侧调用原型：python侧定义IR PASS，并从...

#TVM #CPP

2023年08月09日

tvm-多线程代码生成和运行

调用链tvm搜索算子在需要多线程运行的算子，是在codegen阶段时插入TVMBackendParallelLaunch的调用。 TVMBackendParallelLaunch 是tvm的线程池并行化入口，具体如下 /*! * \brief The callback function to ex...

技术 #TVM #CPP

2023年08月09日

C++'s most vexing parse

C++’s most vexing parse 是 Scott Meyers 在其名著《Effective STL》中创造的一个术语。Scott 用这个术语来形容 C++ 标准对于 declaration 语句的消歧义（ambiguity resolution）约定与常人的认知相悖。最令人烦恼的解...

技术 #CPP

2019年04月26日

柔性数组

这个问题是阿里的一个面试题。当时没有很清楚，答得很差，特地实验看一下运行结果。在结构体中定义了一个char*指针，与定义一个零元素的char数组有什么区别？作用常用来构成缓冲区。比起指针，用空数组有这样的优势：不需要初始化，数组名直接就是所在的偏移；不占任何空间，指针需要占用int长度...

技术 #CPP