#1196 训练和调试时数据集解压很慢

Closed
created 4 months ago by ZzTodd · 3 comments
ZzTodd commented 4 months ago
<!-- 为了更有效地识别与解决您的问题,请尽可能的补充如下信息 --> ### 问题描述 求问对于一个比较大的数据集(大约3G,每次训练和调试都需要加载并解压吗?且采用unzip命令解压的时候速度很慢的问题如何解决呢? ### 相关环境(GPU/NPU) ### 相关集群(启智/智算) ### 任务类型(调试/训练/推理) ### 任务名 ### 日志说明或问题截图 ### 期望的解决方案或建议
liuzx commented 4 months ago
Collaborator
目前的资源调度逻辑是需要每次解压的。3个g的数据解压很慢是需要多久,具体是哪个数据集呢?
ZzTodd commented 4 months ago
Poster
> 目前的资源调度逻辑是需要每次解压的。3个g的数据解压很慢是需要多久,具体是哪个数据集呢? 是我自己的数据集,目前我只是在调试任务中解压过,设备用的是T4,对于大概32W张的360*360的图片,我通过设置进度条查看,全解压完大概需要5个小时
tanglj added the
need review
label 4 months ago
liuzx commented 4 months ago
Collaborator
建议调试任务只用小数据进行调试,在训练任务中使用这类数据集;数据集里的图片数量较多,这个解压速度在调试任务中是正常的。
liuzx closed this issue 4 months ago
Sign in to join this conversation.
No Milestone
No Assignees
2 Participants
Notifications
Due Date

No due date set.

Dependencies

This issue currently doesn't have any dependencies.

Loading…
There is no content yet.