#14 命名实体 识别,词性标注,内容挖掘、语义分析与篇章分析

Closed
created 1 year ago by hyx123 · 1 comments
hyx123 commented 1 year ago
hyx123 commented 1 year ago
Owner
1)命名实体识别问题 相关概率,定义 相关任务类型 方法(基于规程->基于大规模语料库) 2)未登录词的解决方法(搜索引擎,基于语料) 3)CRF解决命名实体识别(NER)流程总结: 训练阶段:确定特征模板,不同场景(人名,地名等)所使用的特征模板不同,对现有语料进行分词,在分词结 果基础上进行词性标注(可能手工),NER对应的标注问题是基于词的,然后训练CRF模型,得到对应权值参数值 识别过程:将待识别文档分词,然后送入CRF模型进行识别计算(维特比算法),得到标注序列,然后根据标 注划分出命名实体 4)词性标注(理解含义,意义)及其一致性检查方法(位置属性向量,词性标注序列向量,聚类或者分类算法)
hyx123 closed this issue 1 year ago
Sign in to join this conversation.
No Label
No Milestone
No Assignees
1 Participants
Notifications
Due Date

No due date set.

Dependencies

This issue currently doesn't have any dependencies.

Loading…
There is no content yet.