AlphabetaX commented on issue zeizei/OpenI_Learning#363
【缺陷】点击再次调试会出现两个同样的任务上周这个问题又出现的,再次裂变成两个任务。 现在我这个版本裂变成三个版本了。 
1 month ago
AlphabetaX commented on issue zeizei/OpenI_Learning#341
【缺陷】优化jupter终端连接稳定性确实5、6一般仅出现在网络不稳定的情况,我实际是开了个爬虫或者用了代理。1~4在网络通畅也会出现。 不过个人觉得平台兼容适应一定网络不稳定也是有必要的。 类似下载过程的断点续传,大文件下载过程,很难避免偶尔网络不稳定,断了就完全重新下载,是比较痛苦的。 目前同样网络条件可在kaggle上使用稳定,colab上偶尔重连(因为梯子)。 如果时间有限可优先优化文件保存,如上所属,kaggle的方法是识别自动保存异常然后提示下载文件。 > 第六点有没有可能是您的网络不稳定,第一点我也遇到了,会出现某个notebook不能连上内核,但其他都能连上
3 months ago
AlphabetaX commented on issue zeizei/OpenI_Learning#312
公开镜像不能使用的问题同样被镜像问题卡了很长时间。 怀疑是大镜像,加大数据集导致的。 发现的不可用镜像: pytorch-180-cuda111-python38 pytorch-180-cuda111-python38-apex 这两个镜像,尝试了很多很多次,在无数据集时,仅有一次可用,有数据集时不可用。
4 months ago
AlphabetaX commented on issue zeizei/OpenI_Learning#314
建议显示每种GPU的排队数,让开发者可以自由选择空余的GPU。由于目前的机制是,建立创建任务后GPU和环境绑定任务的。 而如果需要根据空余情况和调试、训练的需要,切换不同种类GPU。 (比如有时是先编辑测试代码,不需要GPU时就可以切换到CPU,需要尝试训练时就能切换到响应的GPU。) 则需要先把之前任务中的资料下载出来,重新创建。 所以最好是gpu、任务、环境可以解耦合,在界面中切换。 比如在重新调试按键附近切换,或者jupter终端中切换 并且在切换按钮旁边,可以显示当前排队量
4 months ago
AlphabetaX commented on issue zeizei/OpenI_Learning#314
建议显示每种GPU的排队数,让开发者可以自由选择空余的GPU。由于目前的机制是,建立创建任务后GPU和环境绑定任务的。 而如果需要根据空余情况和调试、训练的需要,切换不同种类GPU。 (比如有时是先编辑测试代码,不需要GPU时就可以切换到CPU,需要尝试训练时就能切换到响应的GPU。) 则需要先把之前任务中的资料下载出来,重新创建。 所以最好是gpu、任务、环境可以解耦合,在界面中切换。 比如在重新调试按键附近切换,或者jupter终端中切换 并且在切换按钮旁边,可以显示当前排队量
4 months ago
AlphabetaX commented on issue zeizei/OpenI_Learning#293
【建议】在调试界面中加入GPU/NPU/CPU使用率,和显存/内存使用率和历史图标(参考Colab)关于训练任务的类似需求,在详情页增加GPU使用率: https://openi.pcl.ac.cn/OpenI/aiforge/issues/2324
4 months ago
AlphabetaX commented on issue zeizei/OpenI_Learning#313
【建议】调试任务中,进入终端界面加载,增加加载进度显示#278 的问题可能也是类似原因,是跳转到 鹏程云脑 从 #230 和 https://openi.pcl.ac.cn/OpenI/aiforge/issues/3106 目前方案是延迟调试按钮的显示,不过等待较长时间也让人费解,特别是新人 等待状态应该是显示“排队分配资源中,还有n个任务在前”。 这边给这样建议,期待平台逐步完善 > 此问题相关在https://openi.pcl.ac.cn/zeizei/OpenI_Learning/issues/230 也有提及,应该问题类似。
4 months ago
AlphabetaX commented on issue zeizei/OpenI_Learning#292
【建议】在云脑任务交互界面中,加入相关集群和平台等方面的维护公告这个真的有点重要,目前平台快速完善中,会经常维护,使用的人也不少,一维护就有不少issue和微信群里报障。
4 months ago
AlphabetaX commented on issue zeizei/OpenI_Learning#305
数据集上传系列问题是的,这个最好能把分包自动断点续传,不是人手动全部再传一遍,否则要重试很多次。
4 months ago
AlphabetaX commented on issue zeizei/OpenI_Learning#308
希望可以支持下载任务当中的文件夹哈哈,我就是这么干的 > 目前可以尝试在代码中使用zipfile库打包结果文件,放在输出文件夹下
4 months ago
AlphabetaX opened issue zeizei/OpenI_Learning#293
【建议】在调试界面中加入GPU/NPU/CPU使用率,和显存/内存使用率和历史图标(参考Colab)。4 months ago