关于GCU、沐曦GPGPU、MLU、0卡V100资源4月7日恢复上架的公告>>> 关于共建具身智能开源数据集的倡议>>> 关于云脑任务中统一路径访问方式的公告>>> 关于将启智集群GPU资源迁移至智算集群的公告>>>

huolongshe d1a803c284 init commit		2 months ago
app	init commit	9 months ago

docs	init commit	9 months ago

.gitignore	init commit	9 months ago

Dockerfile	init commit	9 months ago

LICENSE	init commit	9 months ago

README.md	init commit	2 months ago

application.yml	init commit	9 months ago

build-docker.sh	init commit	9 months ago

pack_model.py	init commit	9 months ago

pip-install-reqs.sh	init commit	9 months ago

requirements.txt	init commit	9 months ago

run_model_server.py	init commit	9 months ago

中文分词-LSTM-电商领域

中文分词任务就是把连续的汉字分隔成具有语言语义学意义的词汇。中文的书写方式不像英文等日耳曼语系语言词与词之前显式的用空格分隔。为了让计算机理解中文文本，通常来说中文信息处理的第一步就是进行文本分词。

本方法采用char-BiLSTM-CRF模型，word-embedding使用Chinese-Word-Vectors。序列标注标签体系(B、I、E、S),四个标签分别表示单字处理单词的起始、中间、终止位置或者该单字独立成词。char-BiLSTM-CRF模型具体结构可以参考论文 Neural Architectures for Named Entity Recognition

电商领域的分词训练数据基于电商搜索Query和标题数据标注得到, 对比通用领域分词模型, 主要提升对电商领域特有的品牌、品类、商品修饰等词汇的切分准确率.

模型来源： https://www.modelscope.cn/models/damo/nlp_lstmcrf_word-segmentation_chinese-ecommerce/summary

模型应用开发和部署

模型服务化

本模型基于 ServiceBoot微服务引擎进行服务化封装，参见：《CubeAI模型开发指南》

直接源代码运行

$ sh pip-install-reqs.sh
$ serviceboot start
或
$ python3 run_model_server.py

本地容器化部署

一键式本地容器化部署和运行，参见：《CubeAI模型独立部署指南》或 CubeAI Docker Builder

云原生网络部署

本模型服务可一键发布至 CubeAI智立方平台进行共享和部署，参见：《CubeAI模型发布指南》

更多CubeAI模型服务，参见：《CubeAI服务原生模型示范库》

No Description

Python Shell Text Dockerfile

How to access data resources in code