关于GCU、沐曦GPGPU、MLU、0卡V100资源4月7日恢复上架的公告>>> 关于共建具身智能开源数据集的倡议>>> 关于云脑任务中统一路径访问方式的公告>>> 关于将启智集群GPU资源迁移至智算集群的公告>>>

ZhuiyiTechnology a79a412cca Update main.py		1 year ago
clue	Update README.md	2 years ago

multi-task	Update main.py	1 year ago

LICENSE	Add files via upload	2 years ago

README.md	Update README.md	1 year ago

train_mlm.py	Create train_mlm.py	2 years ago

README.md

RoFormerV2
- 介绍
- 环境
- 下载
- 训练
- 配置
- 引用
- 联系

RoFormerV2

RoFormer升级版，主要通过结构的简化来提升速度，并通过无监督预训练和有监督预训练的结合来提升效果，从而达到了速度与效果的“双赢”。

介绍

博客：https://kexue.fm/archives/8998

环境

bert4keras >= 0.11.0

下载

Small版：chinese_roformer-v2-char_L-6_H-384_A-6.zip、百度云(提取码：ttn4)
Base版：chinese_roformer-v2-char_L-12_H-768_A-12.zip、百度云(提取码：pfoh)
Large版：chinese_roformer-v2-char_L-24_H-1024_A-16.zip、百度云(提取码：npfv)

训练

多任务训练代码参考 https://github.com/ZhuiyiTechnology/roformer-v2/tree/main/multi-task

配置

Small版：两张3090（24G），先用无监督MLM训练了100万步（maxlen为512），然后有监督多任务训练了75万步（maxlen从64到512不等，取决于任务），batch_size为512，优化器为LAMB；
Base版：四张3090（24G），先用无监督MLM训练了100万步（maxlen为512），然后有监督多任务训练了75万步（maxlen从64到512不等，取决于任务），batch_size为512，优化器为LAMB；
Large版：两张A100（80G），先用无监督MLM训练了100万步（maxlen为512），然后有监督多任务训练了50万步（maxlen从64到512不等，取决于任务），batch_size为512，优化器为LAMB。

注：无监督的训练数据为280G，有监督的训练数据约为20G（77个标注数据集，构建了92个任务进行多任务训练，涵盖文本分类、文本匹配、阅读理解、信息抽取、指代消解等常见自然语言理解任务），large版的有监督训练步数更少，是因为20G的标注数据实在不够“喂饱”large级别的模型，继续训练下去出现了过拟合现象。

引用

Bibtex：

@techreport{roformerv2,
  title={RoFormerV2: A Faster and Better RoFormer - ZhuiyiAI},
  author={Jianlin Su, Shengfeng Pan, Bo Wen, Yunfeng Liu},
  year={2022},
  url="https://github.com/ZhuiyiTechnology/roformer-v2",
}

联系

邮箱：ai@wezhuiyi.com
追一科技：https://zhuiyi.ai

No Description

Python

51402681+ZhuiyiTechnology@users.noreply.github.com

How to access data resources in code

README.md

RoFormerV2

介绍

环境

下载

训练

配置

引用

联系

Contributors (1) All

Contributors (1)
All