语言模型(重要):通过语料计算某个句子出现的概率(概率表示),常用的有2-元模型,3-元模型
语言模型应用: 语音识别歧义消除例如,给定拼音串:ta shi yan yan jiu saun fa de
可能的汉字串:踏实烟酒算法的 他是研究酸法的 他是研究算法的,显然,最后一句才符合。
语言模型的启示:
1、开启自然语言处理的统计方法 2、统计方法的一般步骤: 收集大量语料 对语料进行统计分析,得出知识 针对场景建立算法模型 解释和应用结果
数据平滑:
数据平滑的概念,为什么需要平滑 平滑的方法,加一法,加法平滑法,古德-图灵法,J-M法,Katz平滑法等
语言模型的缺陷:
语料来自不同的领域,而语言模型对文本类型、主题等十分敏感 n与相邻的n-1个词相关,假设不是很成立。
No due date set.
This issue currently doesn't have any dependencies.
Deleting a branch is permanent. It CANNOT be undone. Continue?
语言模型(重要):通过语料计算某个句子出现的概率(概率表示),常用的有2-元模型,3-元模型
语言模型应用:
语音识别歧义消除例如,给定拼音串:ta shi yan yan jiu saun fa de
语言模型的启示:
数据平滑:
语言模型的缺陷: