我正在尝试从视觉上比较三种不同的新闻出版物如何涵盖不同的主题(通过LDA主题模型确定)。我有两种相关的方法,但是从同事那里收到很多反馈,说这不是很直观。我希望外面有人对它可视化有更好的主意。
在第一个图中,我显示了每个出版物中每个主题的比例,如下所示:
对于几乎所有与我交谈过的人来说,这都是非常简单直观的。但是,很难看到出版物之间的差异。哪个报纸报道的话题更多?
为此,我绘制了主题比例最高的出版物与主题排名第二的出版物之间的差异,并按主题排名最高的出版物进行了区分。像这样:
因此,举例来说,足球的巨大标杆实际上就是al-Ahram English到Daily News Egypt(足球报道中排名第二)之间的距离,并且由于Al-Ahram排名第一而被涂成了红色。同样,审判是绿色的,因为“埃及独立报”的比例最高,条形大小是“埃及独立报”与“每日新闻埃及报”之间的距离(再次为#2)。
我必须在两段中全部解释这一事实,这是一个很肯定的迹象,表明该图未通过自给自足测试。仅仅看一下就很难说出到底发生了什么。
关于如何以更直观的方式在视觉上突出显示每个主题的主要出版物的任何一般建议?
编辑2:这是一个初步的点图版本,其点的直径与主题在主体中的比例成正比(这是主题最初的排序方式)。尽管我仍然需要进行一些微调,但感觉比以前更加直观。感谢大家!