Questions tagged «data-visualization»

构建有意义且有用的数据图形表示。(如果您的问题只是关于如何使特定软件产生特定效果的问题,那么这里可能就没有主题。)

2
显示贝叶斯模型平均(BMA)优点的简单示例
我将贝叶斯模型平均(BMA)方法纳入研究,并将很快向同事介绍我的工作。但是,BMA在我的领域并没有那么知名,因此在向他们介绍所有理论之后并将其实际应用于我的问题之前,我想提出一个简单而有启发性的示例,说明BMA为何起作用。 我在考虑一个简单的示例,其中有两个模型可供选择,但是真正的数据生成模型(DGM)介于两者之间,证据并不真正支持其中的任何一个。因此,如果您选择一个并继续进行下去,则将忽略模型不确定性并产生错误,但是BMA尽管真实模型不是模型集的一部分,但至少可以正确给出感兴趣参数的后验密度。例如,每天有两个天气预报(A和B),并且一个人希望最好地预测天气,因此在经典统计中,您首先会尝试找到两者之间的最佳天气预报者,但是如果真相介于两者之间,该怎么办? (也就是说,有时A是正确的,有时B是正确的)。但是我无法将其形式化。那样的东西,但是我很愿意接受想法。我希望这个问题足够具体! 在文献中,到目前为止,我还没有找到任何很好的例子: Kruschke(2011)虽然很好地介绍了贝叶斯统计,但并没有真正关注BMA,而他在第4章中介绍的抛硬币示例对于介绍贝叶斯统计非常有用,但并没有真正说服其他研究人员使用BMA。(“为什么我又有三个模型,一个为什么说硬币是公平的,而另一个说它在任一方向上都有偏见?”) 我阅读的所有其他内容(Koop 2003,Koop / Poirier / Tobias(2007),Hoeting等人(1999)以及大量其他文章)都是很好的参考,但是我还没有在其中找到一个简单的玩具示例。 但是也许我只是错过了一个很好的消息来源。 那么,有没有人有介绍BMA的好榜样?也许甚至显示出可能性和后继者,因为我认为这将很有启发性。


2
阅读箱须图:是否可以收集组之间的显着差异?
假设我们正在查看这个箱须图: 在周四和周五之间,我认为大多数人都会同意,睡眠时间似乎有很大差异。但是,这是一个统计上有效的猜想吗?由于周四和周五之间两个四分位数的范围都没有重叠,我们能否辨别出显着差异?星期四和星期五的上下晶须重叠的事实又如何呢?这会影响我们的分析吗? 通常伴随这样的图表是某种方差分析,但我很好奇,仅通过查看箱线图我们能说出多少组之间的差异。

3
可视化二元二项分布
问题:二元二项分布在3维空间中是什么样的? 下面是我想针对各种参数值可视化的特定功能;即,和。p 1 p 2nnnp1p1p_{1}p2p2p_{2} f(x1,x2)=n!x1!x2!px11px22,x1+x2=n,p1+p2=1.f(x1,x2)=n!x1!x2!p1x1p2x2,x1+x2=n,p1+p2=1.f(x_{1},x_{2}) = \frac{n!}{x_{1}!x_{2}!}p_{1}^{x_{1}}p_{2}^{x_{2}}, \qquad x_{1}+x_{2}=n, \quad p_{1}+p_{2}=1. 注意,有两个约束;和。另外,是一个正整数,例如。p 1 + p 2 = 1 n 5x1+x2=nx1+x2=nx_{1}+x_{2}=np1+p2=1p1+p2=1p_{1}+p_{2}=1nnn555 在使用LaTeX(TikZ / PGFPLOTS)进行了两次绘图功能的尝试。这样做,我得到以下图形的以下值:,和以及,和分别为。我尚未成功实现对域值的约束;,所以我有些困惑。p 1 = 0.1 p 2 = 0.9 n = 5 p 1 = 0.4 p 2 = 0.6 x 1 + x 2 = nn=5n=5n=5p1=0.1p1=0.1p_{1}=0.1p2=0.9p2=0.9p_{2}=0.9n=5n=5n=5p1=0.4p1=0.4p_{1}=0.4p2=0.6p2=0.6p_{2}=0.6x1+x2=nx1+x2=nx_{1}+x_{2}=n 用任何语言生成的可视化效果都很好(R,MATLAB等),但是我正在使用TikZ …

3
绘制结果仅具有平均值和标准偏差
我正在尝试在此表中的观察值和召回得分的标准差的可视化中绘制一个合适的图: 召回控制意思37标清8实验性意思21标清6控制实验性意思标清意思标清召回378216\begin{array} {c|c c|c c|} & \text{Control} & & \text{Experimental} & \\ & \text{Mean} & \text{SD} &\text{Mean} &\text{SD} \\ \hline \text{Recall} & 37 & 8 & 21 & 6 \\ \hline \end{array} 最好的方法是什么?条形图是一个好方法吗?在这种情况下如何说明标准偏差?


1
我的ACF图告诉我有关数据的什么信息?
我有两个数据集: 我的第一个数据集是相对于时间的投资价值(十亿美元),每个单位时间是自1947年第一季度以来的四分之一。时间一直延伸到2002年第三季度。 我的第二个数据集是“将[第一个数据集]中的投资值转换为近似平稳过程的结果”。 第一组数据和第二组数据 相应的ACF图: 我知道这些情节是正确的,因此请我“对其进行评论”。我对自动相关功能还比较陌生,我也不完全确定它能告诉我有关我的数据的信息。 如果有人可以花时间简短地解释一下,将不胜感激。

2
在逻辑回归中可视化类别的影响及其普遍性的最佳方法是什么?
我需要使用民意调查数据来介绍有关候选人投票的主要预测因子的信息。我已经使用我关心的所有变量进行了逻辑回归,但是我找不到一种很好的方式来显示此信息。 我的客户不仅在乎效果的大小,而且在乎效果的大小与具有此类属性的总体大小之间的相互作用。 如何在图形中处理呢?有什么建议么? 这是一个例子: 当候选变量中因变量为Vote / Not时,变量SEX(Male = 1)的为2.3,这是取幂并被视为比值比或概率后的大数。但是,进行此调查的社会只有30%的男性。因此,尽管人非常支持该候选人,但对于试图赢得多数选举的候选人而言,他们的人数并不重要。ββ\beta

3
纽曼的网络模块化是否适用于带符号的加权图?
图的模块性在其Wikipedia页面上定义。在另一篇文章中,有人解释说,可以轻松地为加权网络计算(并最大化)模块化,因为邻接矩阵也可以包含有价值的联系。但是,我想知道这是否也适用于带符号的,有价值的边缘(例如,从-10到+10)。您可以提供有关此问题的直觉,证据或参考吗?一种我Ĵ一种一世ĴA_{ij}

2
统计上真实网络/图形中的所有边缘偶然发​​生的可能性是什么意思?
我一直在使用本文概述的骨干网提取方法:http : //www.pnas.org/content/106/16/6483.abstract 基本上,作者提出了一种基于统计的方法,该方法为图形中的每个边产生概率,该边可能只是偶然发生。我使用的典型统计显着性临界值为0.05。 我一直在将这种方法应用于多个现实世界的网络,有趣的是,某些网络最终没有任何重要的优势。我试图了解这对网络意味着什么。我将方法应用于网络并且没有出现任何明显边缘的唯一一次是当我将方法应用于生成的随机网络时,这正是我们所期望的。 作为一个现实世界网络的示例,您可能已经看到《经济学人》上最近的网络可视化,显示了过去25年美国参议院的两极分化:http://www.economist.com/news/united-states/21591190 -united态阿米巴原虫。我将骨干网提取方法应用于这些网络,并且没有出现明显的边缘。即使原始边缘显然显示出优先的附着和聚类,这仅仅是偶然吗?参议院投票网络基本上是随机的吗?


8
可视化高维数据
我有两个类别的样本,它们是高维空间中的向量,我想将它们绘制为2D或3D。 我了解降维技术,但是我需要一个非常简单易用的工具(在matlab,python或预构建的.exe中)。 我也想知道2D表示会“有意义”吗?(例如,两个类如何相交或可分离)。

2
泊松回归如何可视化?
我想将代码缺陷与代​​码复杂性指标(如紧密度)相关联。一种常见的模型是将其视为泊松过程,其中持续时间是编码花费的时间,而密度是编码复杂度的函数。我能够进行回归并获得显着性值等。 但是,对我而言,很难直观地看到结果(对于数学上不太喜欢的同事而言,则更加困难)。如果是线性趋势等,是否有一种很好的方法来查看异常值?(感谢您链接到R包。) 例如,我可以绘图,Defects / Time ~ Complexity但是这很嘈杂,并且由于Defects离散且很小,所以很难查看趋势。我想到的一件事是,我可以将数据切成分位数,然后对每个分位数进行回归并绘制结果密度-我不确定这是否有效,尤其是因为我的数据不是正态分布的,因此在分位数上误导人们。

2
QQ剧情解读
考虑以下代码和输出: par(mfrow=c(3,2)) # generate random data from weibull distribution x = rweibull(20, 8, 2) # Quantile-Quantile Plot for different distributions qqPlot(x, "log-normal") qqPlot(x, "normal") qqPlot(x, "exponential", DB = TRUE) qqPlot(x, "cauchy") qqPlot(x, "weibull") qqPlot(x, "logistic") 看来,对数正态的QQ图与weibull的QQ图几乎相同。我们如何区分它们?此外,如果这些点在两条外部黑色线所定义的区域内,是否表示它们遵循指定的分布?

1
什么是“行李箱图”或“双变量箱图”?
我找到了一篇介绍箱型图的多维(此处为双变量)版本的文章-风箱图。那是什么风筝呢?我可以看到一系列基于顶点的嵌套多边形,其中一个多边形被声明为风标图。嵌套多边形构建的想法是什么?风标图是哪个多边形(中心或保持平均点数)?Bagplot的边缘是否具有一些有用的属性(例如专门划分点集)?

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.