共计 10 篇文章
2026
Linux环境下在CPP项目内引用torch相关库完成编译
2025
使用NVIDIA modelopt代替pt-quantization进行模型量化并使用TRT导出INT8模型
CUDA Stream和CUDA Event
CUDA中的Bank Conflict与Memory Coalesce
使用Pytorch的cpp_extension调用外部C函数
使用NV的toolkit对算子进行debug与性能测试
使用Model-opt对模型进行剪枝(Prune)与子网搜索(NAS)
自定义pytorch算子并导出可推理的onnx文件
CV中常用的骨干网络简述与其量化方式
量化友好的SR-STE稀疏化训练