最大熵模型
- 1. 最大熵模型 与 自然语言处理 MaxEnt Model & NLP laputa [email_address] NLP Group, AI Lab, Tsinghua Univ.
- 33. 最大熵模型 Maximum Entropy What is Constraints? -- 模型要与 已知 知识吻合 What is known? -- 训练数据集合 一般模型: P={p|p 是 X 上满足 条件 的概率分布 }
- 36. 特征与样本 已知: “ 学习”可能是动词,也可能是名词。可以被标为主语、谓语、宾语、定语…… “ 学习”被标为定语的可能性很小,只有 0.05 特征:当“学习”被标作动词的时候,它被标作谓语的概率为 0.95 x 是什么 ? y 是什么 ? 样本是什么 ?
- 37. 特征与样本 已知: “ 学习”可能是动词,也可能是名词。可以被标为主语、谓语、宾语、定语…… 特征:“学习”被标为定语的可能性很小,只有 0.05 当“学习”被标作动词的时候,它被标作谓语的概率为 0.95 x 是什么 ? y 是什么 ? 样本是什么 ?
- 38. 特征与样本 特征函数:对于一个特征 (x 0 ,y 0 ) ,定义特征函数: 特征函数期望值: 对于一个特征 (x 0 ,y 0 ) ,在样本中的期望值是: 是 (x,y) 在样本中出现的概率
- 39. 条件( Constraints ) 条件: 对每一个特征 (x,y) ,模型所建立的条件概率分布要与训练样本表现出来的分布相同。 假设样本的分布是(已知): 特征 f 在模型中的期望值: