低维空间的尺寸没有意义。请注意,t-SNE损失函数仅基于点之间的距离(和)以及这些距离上的概率分布(和):ÿ一世ÿĴp我Ĵq我Ĵ
δCδÿ一世= 4 ∑Ĵ(p我Ĵ- q一世Ĵ)( y一世- ÿĴ)(1 + | | y一世- ÿĴ||2)− 1
因此,没有从整个高维空间到低维空间的投影,t-SNE仅找到从一组特定的高维点到一组特定的低维点的映射。因为从一个空间到另一个空间没有功能,所以也没有轴的固有含义。
您可以想象的事情说明了这一点:
- 旋转或平移高维或低维空间不会影响点之间的距离。因此,t-SNE不在乎两个空间中的旋转或平移。因此,没有绝对的轴解释。
- t型学生分布有肥大的尾巴。这导致低维表示对于高维空间中较远的点的变化是不变的。这也导致在高维空间中较远的点在低维空间中可以合理地相距很远,或者很远。从这个意义上讲,它拉伸了低维轴的某些部分(沿任意方向)。
就是说,t-SNE主要是一种可视化技术,其降维效果在其他目的上并不明显(可能不适用于聚类,特征提取或特征选择)。
另:纸。