#2 更新 'README.md'

Merged
fandd merged 1 commits from zhuxh/fandd202205131033185:master into master 1 year ago
  1. +5
    -0
      README.md

+ 5
- 0
README.md View File

@@ -226,6 +226,11 @@ PS: 下面截图看起来有点小,请将网页放大后观察 ^_^!
4. BUG1: cuda error: no kernel image is available for execution on the device
这个bug 问题出现在 Apex(https://github.com/NVIDIA/apex)使用过程中,换机器就会出现,因此需要在每台机器运行命令前,重新编译。
命令为: python setup.py install --cuda_ext --cpp_ext

5. BUG2: 在使用pytorch时候,可能会出现,程序被断了,但是显存依然在被占用的情况。但是云脑nvidia-smi命令并不会给出程序的PID, 因此需要调用这个命令:(当然保证你的训练命令里是有python的)
ps aux|grep root|grep python
这样就可以看到PID,进而kill掉,释放无用显存。




Loading…
Cancel
Save