#942 提供一个数据迁移的工具/接口

Open
created 1 year ago by thomas-yanxin · 0 comments
<!-- 为了更有效地识别与解决您的问题,请尽可能的补充如下信息 --> ### 问题描述 最近准备把几个100G的数据集上传到启智,会很麻烦… 通常在从外部数据平台将数据迁移到启智平台的时候,需要先从外部数据平台下载到本地,再从本地将数据上传到启智。 这存在几个问题: 1. 本地电脑是中间暂存态,其实很麻烦,能不能把中间的这一步骤省去; 2. 数据可能较大,本地电脑无法做中间态存储,迁移会比较麻烦。 ### 期望的解决方案或建议 可能的建议: 1. 打通主流的数据集平台,形成一套标准的数据集读取接口(不知道格物钛是不是有类似的); 2. 打通网盘接口,如百度网盘、阿里云盘等,蛮多大型的数据集会存在百度网盘进行传播; 3. 很多数据集是通过url下载的,可否提供一个工具,用户只需要提供url,平台可以自己下载。 另外存在以下场景: 用户在调试环境里wget了某个数据集,并在调试环境里处理好了这个数据集,能不能提供一个接口,用户可以直接从调试环境里导出这个处理好的数据集。
zeizei added the
enhancement
label 1 year ago
tanglj was assigned by zeizei 1 year ago
tanglj added the
need review
label 1 year ago
liuzx added the
开发中
label 11 months ago
Sign in to join this conversation.
No Milestone
No Assignees
1 Participants
Notifications
Due Date

No due date set.

Dependencies

This issue currently doesn't have any dependencies.

Loading…
There is no content yet.