共计 16 篇文章
2026
记录一个conda相关的编译与链接错误 "undefined symbol:__cxa_call_terminate"
Linux环境下在CPP项目内引用torch相关库完成编译
2025
C++中的名称修饰与命名空间
使用NVIDIA modelopt代替pt-quantization进行模型量化并使用TRT导出INT8模型
CUDA Stream和CUDA Event
CUDA中的Bank Conflict与Memory Coalesce
使用Pytorch的cpp_extension调用外部C函数
使用NV的toolkit对算子进行debug与性能测试
使用Model-opt对模型进行剪枝(Prune)与子网搜索(NAS)
自定义pytorch算子并导出可推理的onnx文件