您可以通过降低批量大小来减少内存使用量,@John Stud评论说,或者使用自动混合精度,@德怀特Foster建议。...
社区项目 github.com/harrisonvand 已支持直接纯 CUDA 运行 RWKV,用户可以直接运行 exe,不需要 pytorch 也不需要装 CUDA(开发者编译需要装 CUDA,用户运行不需要装 CUDA)。 编译方法:进 examples 的项目目录,执行 build.bat 之类。先装 VS2022(VC++)。目前这个项目的 bug 很多,例如生成不了中文,大家欢迎提 iss...
DirectML.1.14.1 The model works fine on the Python side — the correct output and it exports fine. The problem happens when trying to load on CPP with Onnxruntime. Note that I am using DIrectML execution provider. Also, other models load and work fine in the CPP code. So, the problem...