#314 建议显示每种GPU的排队数,让开发者可以自由选择空余的GPU。

Open
created 6 months ago by crayon · 5 comments
crayon commented 6 months ago

问题描述

大家选择显卡时一般都会选择性能最高的GPU,有一些GPU没有充分利用,显示每种显卡排队数可以充分利用平台资源。

相关环境(GPU/NPU)

GPU

相关集群(启智/智算)

任务类型(调试/训练/推理)

训练

任务名

日志说明或问题截图

期望的解决方案或建议

<!-- 为了更有效地识别与解决您的问题,请尽可能的补充如下信息 --> ### 问题描述 大家选择显卡时一般都会选择性能最高的GPU,有一些GPU没有充分利用,显示每种显卡排队数可以充分利用平台资源。 ### 相关环境(GPU/NPU) GPU ### 相关集群(启智/智算) ### 任务类型(调试/训练/推理) 训练 ### 任务名 ### 日志说明或问题截图 ### 期望的解决方案或建议
crayon changed title from 建议显示每种显卡的排队数,让开发者可以自由选择空余的显卡。 to 建议显示每种GPU的排队数,让开发者可以自由选择空余的显卡。 6 months ago
crayon changed title from 建议显示每种GPU的排队数,让开发者可以自由选择空余的显卡。 to 建议显示每种GPU的排队数,让开发者可以自由选择空余的GPU。 6 months ago

由于目前的机制是,建立创建任务后GPU和环境绑定任务的。
而如果需要根据空余情况和调试、训练的需要,切换不同种类GPU。
(比如有时是先编辑测试代码,不需要GPU时就可以切换到CPU,需要尝试训练时就能切换到响应的GPU。)
则需要先把之前任务中的资料下载出来,重新创建。
所以最好是gpu、任务、环境可以解耦合,在界面中切换。
比如在重新调试按键附近切换,或者jupter终端中切换
并且在切换按钮旁边,可以显示当前排队量

由于目前的机制是,建立创建任务后GPU和环境绑定任务的。 而如果需要根据空余情况和调试、训练的需要,切换不同种类GPU。 (比如有时是先编辑测试代码,不需要GPU时就可以切换到CPU,需要尝试训练时就能切换到响应的GPU。) 则需要先把之前任务中的资料下载出来,重新创建。 所以最好是gpu、任务、环境可以解耦合,在界面中切换。 比如在重新调试按键附近切换,或者jupter终端中切换 并且在切换按钮旁边,可以显示当前排队量

由于目前的机制是,建立创建任务后GPU和环境绑定任务的。
而如果需要根据空余情况和调试、训练的需要,切换不同种类GPU。
(比如有时是先编辑测试代码,不需要GPU时就可以切换到CPU,需要尝试训练时就能切换到响应的GPU。)
则需要先把之前任务中的资料下载出来,重新创建。
所以最好是gpu、任务、环境可以解耦合,在界面中切换。
比如在重新调试按键附近切换,或者jupter终端中切换
并且在切换按钮旁边,可以显示当前排队量

由于目前的机制是,建立创建任务后GPU和环境绑定任务的。 而如果需要根据空余情况和调试、训练的需要,切换不同种类GPU。 (比如有时是先编辑测试代码,不需要GPU时就可以切换到CPU,需要尝试训练时就能切换到响应的GPU。) 则需要先把之前任务中的资料下载出来,重新创建。 所以最好是gpu、任务、环境可以解耦合,在界面中切换。 比如在重新调试按键附近切换,或者jupter终端中切换 并且在切换按钮旁边,可以显示当前排队量

+1,同时希望能显示预计排队用时

+1,同时希望能显示预计排队用时
crayon commented 6 months ago
Poster

+1,同时希望能显示预计排队用时

排队用时可能比较难,因为跑代码不能预知结束时间,就是如果能把每一种空闲GPU都显示出来就可以了,不用都挤着最高级别的GPU。

> +1,同时希望能显示预计排队用时 排队用时可能比较难,因为跑代码不能预知结束时间,就是如果能把每一种空闲GPU都显示出来就可以了,不用都挤着最高级别的GPU。

+1,同时希望能显示预计排队用时

排队用时可能比较难,因为跑代码不能预知结束时间,就是如果能把每一种空闲GPU都显示出来就可以了,不用都挤着最高级别的GPU。
嗯嗯,在创建调试任务界面显示空闲GPU/CPU数目确实挺好的,有些CPU能跑的东西用GPU跑太浪费资源了

> > +1,同时希望能显示预计排队用时 > > 排队用时可能比较难,因为跑代码不能预知结束时间,就是如果能把每一种空闲GPU都显示出来就可以了,不用都挤着最高级别的GPU。 嗯嗯,在创建调试任务界面显示空闲GPU/CPU数目确实挺好的,有些CPU能跑的东西用GPU跑太浪费资源了
lewis was assigned by zeizei 6 months ago
Sign in to join this conversation.
Loading…
There is no content yet.