10 我有点困惑。有人可以向我解释如何基于以二进制项出现为权重的项文档矩阵计算两个项之间的互信息吗? d ø Ç ù 米ë Ñ 吨1d ø Ç ù 米ë Ñ 吨2d ø Ç ù 米ë Ñ 吨3′w ^^ h ÿ′1个1个1个′HØ w ^′1个01个′w ^ħ È Ñ′1个1个1个′w ^^ h è [R é′1个00′w ^Hÿ′′HØw′′w ^HËñ′′w ^HË[RË′dØCü米ËñŤ1个1个1个1个1个dØCü米ËñŤ21个01个0dØCü米ËñŤ31个1个1个0 一世(X; ÿ)= ∑ÿ∈ ÿ∑X ∈ Xp (X ,ÿ)日志(p (x ,y)p (x )p (y))一世(X;Y)=∑y∈Y∑x∈Xp(x,y)log(p(x,y)p(x)p(y)) 谢谢 python information-theory mutual-information numpy pandas — 用户名 source 什么是和ÿ?XXÿÿ — Dilip Sarwate X和Y是项。X可以是“为什么”,Y可以是“如何”。 — user18075
7 如何形成保存文档中归一化共现的联合概率表。然后,您可以使用该表获得联合熵和边际熵。最后, 一世(X,Y)= 高(X)+ H(是)- 高(X,Y)。一世(X,ÿ)=H(X)+H(ÿ)-H(X,ÿ)。 — 佐兰 source 1 确定联合和边际分布后,为什么必须计算,H (Y )和H (X ,Y )并使用您展示的公式?不能通过OP给定的公式直接确定相互信息,因为“插入”所需的所有内容,即。此时已知p (x ,y ),p (x )和p (y )吗?H(X)H(X)H(是)H(ÿ)H(X,Y)H(X,ÿ)p (X ,ÿ),p (x )p(X,ÿ),p(X)p (ÿ)p(ÿ) — Dilip Sarwate 2 公式是等效的,只是乍看之下后者可以更容易解释。 — Zoran