c++扩展算子开发③:CUDA算子的开发 项目说明 在使用c++进行CUDA算子开发 开发流程 编写.cu文件 实现该算子的运算部分,在使用setup.py对算子进行安装时,nvcc程序针对.cu文件进行编译,并最终包含进动态链接库 编写.cpp文件 使得可以在python中调用CUDA kernel函数,.cpp调用上面.cu文件中启动函数,绑定到python中使...
1. 参与深度学习框架OneFlow开发与性能优化; 2. 参与OneFlow CPU/GPU高性能算子库研发 ; 3. 负责深度学习框架OneFlow接口设计。 职位要求: 1. 计算机或电子通信相关专业本科以上; 2. 熟练掌握C++、Python; 3. 熟悉GPU(CUDA、cuDNN、NCCL)编程; 4 良好的软件开发素养,包括T ...
在使用c++进行CUDA算子开发 开发流程 编写.cu文件 实现该算子的运算部分,在使用setup.py对算子进行安装时,nvcc程序针对.cu文件进行编译,并最终包含进动态链接库 编写.cpp文件 使得可以在python中调用CUDA kernel函数,.cpp调用上面.cu文件中启动函数,绑定到python中使用 编写.py文件 实现该算子安装 项目展示 ...