好吧,所以我将继续在这里陈述它,而不是去推导桑德的方程(5)。条件1和2意味着以下相等:
m∏j=1(∑k≠ihkdjk)=(∑k≠ihk)m−1(∑k≠ihkm∏j=1djk)
∏j=1m(∑k≠ihkdjk)=(∑k≠ihk)m−1(∑k≠ihk∏j=1mdjk)
,其中
djk=P(Dj|Hk,I)hk=P(Hk|I)djk=P(Dj|Hk,I)hk=P(Hk|I)
现在我们可以通过取并重新标记来专门研究(两个数据集)的情况。请注意,这两个数据集仍然满足条件1和2,因此上面的结果也适用于它们。现在在的情况下展开,得到:m=2m=2D(1)1≡D1D(1)1≡D1D(1)2≡D2D3…DmD(1)2≡D2D3…Dmm=2m=2
(∑k≠ihkd1k)(∑l≠ihld2l)=(∑k≠ihk)(∑l≠ihld1ld2l)
(∑k≠ihkd1k)(∑l≠ihld2l)=(∑k≠ihk)(∑l≠ihld1ld2l)
→∑k≠i∑l≠ihkhld1kd2l=∑k≠i∑l≠ihkhld1ld2l
→∑k≠i∑l≠ihkhld1kd2l=∑k≠i∑l≠ihkhld1ld2l
→∑k≠i∑l≠ihkhld2l(d1k−d1l)=0(i=1,…,n)
→∑k≠i∑l≠ihkhld2l(d1k−d1l)=0(i=1,…,n)
项在上述两次求和中出现两次,一次是和,一次是和。只要就会发生这种情况。每个项的系数由和。现在,由于这些方程式中有,因此我们实际上可以从这些方程式中删除。为了说明这一点,假设,这意味着我们拥有除和之外的所有条件。现在取(d1a−d1b)(d1a−d1b)k=ak=al=bl=bk=bk=bl=al=aa,b≠ia,b≠id2bd2b−d2a−d2aiiiii=1i=1a=1,b=2a=1,b=2b=1,a=2b=1,a=2i=3i=3,我们现在可以具有这两个条件(请注意,这至少假设了三个假设)。因此,该方程式可以重写为:
∑l>khkhl(d2l−d2k)(d1k−d1l)=0
∑l>khkhl(d2l−d2k)(d1k−d1l)=0
现在,每个项必须大于零,否则我们将处理假设,并且可以根据来重新答案。因此,可以从上述条件中删除这些条件:hihin1<nn1<nn1n1
∑l>k(d2l−d2k)(d1k−d1l)=0
∑l>k(d2l−d2k)(d1k−d1l)=0
因此,必须满足条件,并且每个条件都暗含两个“子条件”之一:对于或(但不一定同时是两者)。现在我们有一个集中的所有唯一对的为。如果我们将个对中的一个作为一个,那么我们将拥有所有数字在集合中,并且。这是因为第一对具有元素,并且每个附加对都将至少一个附加元素带入集合*n(n−1)2n(n−1)2djk=djldjk=djlj=1j=1j=2j=2(k,l)(k,l)djk=djldjk=djln−1n−1jj1,…,n1,…,ndj1=dj2=⋯=dj,n−1=dj,ndj1=dj2=⋯=dj,n−1=dj,n22
但请注意,由于存在条件,因此我们必须至少选择大于或等于表示或。如果则选择的项数大于。如果或那么我们必须精确选择项。这意味着。只有两个假设()才不会发生这种情况。但是,根据桑德(Saunder)文章中的最后一个等式,该相等条件暗示:n(n−1)2n(n−1)212×n(n−1)2=n(n−1)412×n(n−1)2=n(n−1)4j=1j=1j=2j=2n>4n>4n−1n−1n=4n=4n=3n=3n−1n−1dj1=dj2=⋯=dj,n−1=dj,ndj1=dj2=⋯=dj,n−1=dj,nn=2n=2
P(Dj|¯Hi)=∑k≠idjkhk∑k≠ihk=dji∑k≠ihk∑k≠ihk=dji=P(Dj|Hi)
P(Dj|H¯¯¯¯¯i)=∑k≠idjkhk∑k≠ihk=dji∑k≠ihk∑k≠ihk=dji=P(Dj|Hi)
因此,在似然比中,我们有:
P(D(1)1|Hi)P(D(1)1|¯Hi)=P(D1|Hi)P(D1|¯Hi)=1 ORP(D(1)2|Hi)P(D(1)2|¯Hi)=P(D2D3…,Dm|Hi)P(D2D3…,Dm|¯Hi)=1
P(D(1)1|Hi)P(D(1)1|H¯¯¯¯¯i)=P(D1|Hi)P(D1|H¯¯¯¯¯i)=1 ORP(D(1)2|Hi)P(D(1)2|H¯¯¯¯¯i)=P(D2D3…,Dm|Hi)P(D2D3…,Dm|H¯¯¯¯¯i)=1
为了完成证明,请注意,如果第二个条件成立,则结果已经证明,并且只有一个比率可以不同于1。如果第一个条件成立,那么我们可以通过重新标记来重复上述分析。和。那么我们将让不参与贡献,或者是唯一的贡献者。然后,当不提供保留时,我们将进行第三次重新标记,依此类推。因此,当条件1和条件2成立时,只有一个数据集可有助于似然比,并且有两个以上的假设。D(2)1≡D2D(2)1≡D2D(2)2≡D3…,DmD(2)2≡D3…,DmD1,D2D1,D2D2D2D1D2
*注意:额外的一对可能不会带来新的词条,但这将被带来两个新词条的一对抵消。例如,以作为第一个[+2], [+1]和 [+0],但下一项必须对于都具有。这将添加两个项[+2]。如果那么我们就不再需要选择了,但是对于“ other”我们必须选择3对,它们不是。它们是,因此等式成立,因为所有数字都在集合中。dj1=dj2dj1=dj3dj2=dj3djk=djlk,l∉(1,2,3)n=4j(1,2),(2,3),(1,3)(1,4),(2,4),(3,4)(1,2,3,4)