该项目开源了一些自然语言处理的预训练模型。该项目主要关注对话系统的一些基础模型,尤其是电子商务领域。该项目使用 42 GB 的客户服务对话数据 (大约包含 12 亿个句子) 进行训练,并开源了训练好的BERT模型和词嵌入模型。

