t-sne尺寸有意义吗?


18

t-sne嵌入的尺寸有任何含义吗?像PCA一样,我们具有线性变换的方差最大化的感觉,但是对于t-sne,除了我们定义的用于映射和最小化KL距离的空间之外,还有直觉吗?


1
不知道这是否真的满足您的要求,但我相信t-sne的尺寸实际上仅取决于数据的可分离性。给定相同的数据集,尺寸可以更改,因为这是非线性变换。因此,只能在给定实例的上下文中真正解释维。让我知道我是否错了,这是一个有趣的问题。
Hobbes

也许只是无聊的三英镑?
Nitro

Answers:


17

低维空间的尺寸没有意义。请注意,t-SNE损失函数仅基于点之间的距离(和)以及这些距离上的概率分布(和):ÿ一世ÿĴp一世Ĵq一世Ĵ

δCδÿ一世=4Ĵp一世Ĵ-q一世Ĵÿ一世-ÿĴ1个+||ÿ一世-ÿĴ||2-1个

因此,没有从整个高维空间到低维空间的投影,t-SNE仅找到从一组特定的高维点到一组特定的低维点的映射。因为从一个空间到另一个空间没有功能,所以也没有轴的固有含义。

您可以想象的事情说明了这一点:

  • 旋转或平移高维或低维空间不会影响点之间的距离。因此,t-SNE不在乎两个空间中的旋转或平移。因此,没有绝对的轴解释。
  • t型学生分布有肥大的尾巴。这导致低维表示对于高维空间中较远的点的变化是不变的。这也导致在高维空间中较远的点在低维空间中可以合理地相距很远,或者很远。从这个意义上讲,它拉伸了低维轴的某些部分(沿任意方向)。

就是说,t-SNE主要是一种可视化技术,其降维效果在其他目的上并不明显(可能不适用于聚类,特征提取或特征选择)。

另:

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.