作业帮 > 数学 > 作业

狄利克雷分布是个啥东西?最近看的关于文档分类和主题建模方面的论文中看到的运用了LDA模型,就是这个模型

来源:学生作业帮 编辑:大师作文网作业帮 分类:数学作业 时间:2024/11/18 12:49:01
狄利克雷分布是个啥东西?最近看的关于文档分类和主题建模方面的论文中看到的运用了LDA模型,就是这个模型
狄利克雷分布是个啥东西?我不是数学系的,不太懂,因为最近看的关于文档分;类和主题建模方面的论文中看到了LDA方法,就是隐含狄利克雷分配(LDA,Latent Dirichlet Allocation),里面运用了狄利克雷分布函数(好像是),
1、对于每一个作者r=1,...,K,从Dirichlet(α)选择θr
2、为每一个主题z=1,...,T,从Dirichlet(β)中选择Φz
3、对每一个词汇w=1,...,Nc,从所有作者ac中一致的选择一个作者r.
从多项分布(θr)中在r的条件下选择一个主题z.
从多项分布(Φz)中在z的条件下选择一个词w.
从多项分布(Ψz)中在z的条件下选择一个与词汇w相关的年份y.
Gibbs样本用于参数估计.
这个 从Dirichlet(α)选择θr 之类的是啥意思,具体数值怎样得到?
狄利克雷分布是个啥东西?最近看的关于文档分类和主题建模方面的论文中看到的运用了LDA模型,就是这个模型
狄利克雷分布是一个特殊函数,举一个例子来说吧.
狄利克雷分布分布对离散性而言,Dirichlet(x=r)=1,Dirichlet(x不等于r)=0.也就是说Dirichlet函数是一个选择函数.说的具体一点,当i可以依次取从2,4,6,8………1000时,我们就可以求出其中第50个数是Sum(Dirichlet(i))=100,其中Sum是从2,4,6……到1000的求和.你的问题就是属于离散型的Dirichlet函数.
对于连续性的Dirichlet函数,就是冲激函数.Dirichlet函数的在全域的积分等于1.
再问: 求出其中第50个数是Sum(Dirichlet(i))=100,这个能否再详细解释下,我数学学得不太好~~谢谢!那么也就是说,Dir函数的取值是跟参数相关的,dir是多少,取决于它的参数?这个参数也是一个分布吗?
再答: Dir的取值确实与自变量的取值有关。 呵呵……纠正一个错误,i*Sum(Dirichlet(i))=100。