diff --git a/README.md b/README.md index 1ffb27d..c62ed23 100755 --- a/README.md +++ b/README.md @@ -226,6 +226,11 @@ PS: 下面截图看起来有点小,请将网页放大后观察 ^_^! 4. BUG1: cuda error: no kernel image is available for execution on the device 这个bug 问题出现在 Apex(https://github.com/NVIDIA/apex)使用过程中,换机器就会出现,因此需要在每台机器运行命令前,重新编译。 命令为: python setup.py install --cuda_ext --cpp_ext + +5. BUG2: 在使用pytorch时候,可能会出现,程序被断了,但是显存依然在被占用的情况。但是云脑nvidia-smi命令并不会给出程序的PID, 因此需要调用这个命令:(当然保证你的训练命令里是有python的) +ps aux|grep root|grep python +这样就可以看到PID,进而kill掉,释放无用显存。 +