Questions tagged «data-visualization»

构建有意义且有用的数据图形表示。(如果您的问题只是关于如何使特定软件产生特定效果的问题,那么这里可能就没有主题。)

1
这是什么样的图表?
很抱歉这个模糊的问题,但是这张表出现在Biddle等人的文章中。2009年,我之前从未遇到过类似的事情。这是一个带有斜边的条形图,有时是“角”。这些是什么意思?这种图表有名称吗? 根据/meta/244083/site-for-asking-about-charts,我认为学术界是最好的询问场所。


4
与重尾分布相对应的Boxplot吗?
对于近似正态分布的数据,箱形图是快速可视化数据的中值和散布以及任何异常值的好方法。 但是,对于更重尾的分布,很多点显示为离群值,因为离群被定义为不在IQR的固定因子范围内,而对于重尾分布,这种情况当然会更频繁地发生。 那么人们使用什么可视化此类数据呢?还有更适应的东西吗?如果重要的话,我在R上使用ggplot。


4
在R中的一张图上绘制多个图?
使用以下代码,我尝试在中的图形上绘制四个图R。我对图不满意,因为图之间有很多空间,因此图的宽度不足以分析图。 有人可以帮我制作一个有四个图的漂亮图吗? 如何保持X轴标签的范围从1到10,而不是默认的5个标签? 数据: a1:11.013 13.814 13.831 13.714 13.787 13.734 13.778 13.771 13.823 13.659 a2:5.181 7.747 8.314 8.061 7.920 8.153 8.540 8.845 7.881 8.301 我已经将a1数据用于b1,c1和d1;仅用于此处的b2,c2和d2的a2数据。 数字: 码: op=par(mfrow=c(4,1), mar=c(5.5,5.1,4.1,2.1)) plot(a1, type="b", ylim=c(0,14.5), xlab="Time (secs)", ylab="", cex.axis=1.4, cex.lab=1.3,cex=1.2,lwd=2.5,col="red1",lty=2,pch=1, main="A") lines(a2,type="b",pch=3,lty=3,col="darkblue",lwd=2.5,cex=1.2) par(xpd=T) legend(1,26.5,c("X","Y"),bty="n",horiz=T,cex=1.5,col=c("red1","darkblue"),text.col=c("red1","darkblue"),pch=c(1,3),lty=c(2,3),x.intersp=0.4,adj=0.2) plot(b1, type="b", ylim=c(0,14.5), xlab="Time (secs)", ylab="", cex.axis=1.4, cex.lab=1.3,cex=1.2,lwd=2.5,col="red1",lty=2,pch=1, main="B") …

3
平行坐标图的简单说明
我已经阅读并看到了许多平行坐标图。有人可以回答以下问题: 简单来说,什么是平行坐标图(PCP),以便外行可以理解? 可能的话凭直觉进行数学解释 PCP何时有用,何时使用? 如果是PCP 不是有用的时,应避免他们? PCP的可能优缺点

5
数据可视化技术的认知处理/解释
是否有人知道研究不同可视化技术的有效性(可理解性)的研究? 例如,人们相对于另一种形式的可视化理解有多快?与可视化的交互性是否可以帮助人们回忆数据?遵循这些原则。可视化示例可能是:散点图,图形,时间线,地图,交互式界面(如平行坐标)等。 我对非专业人群的研究特别感兴趣。

1
GBM软件包与使用GBM的插入符
我一直在使用进行模型调整caret,但随后使用该gbm软件包重新运行模型。据我了解,caret程序包使用gbm的输出应相同。然而,data(iris)使用RMSE和R ^ 2作为评估指标,使用进行的快速测试显示模型中的差异约为5%。我想使用来找到最佳模型性能,caret但要重新运行gbm以利用部分依赖图。下面的代码具有可重复性。 我的问题是: 1)为什么即使这两个软件包应该相同,我仍会看到这两个软件包之间的差异(我知道它们是随机的,但5%的差异还是很大的,尤其是当我没有使用iris建模时使用的很好的数据集时) 。 2)同时使用这两个软件包有什么优点或缺点? 3)不相关:使用iris数据集时,最佳interaction.depth值为5,但高于我所阅读的最大值,使用最大值floor(sqrt(ncol(iris)))为2。这是严格的经验法则还是非常灵活? library(caret) library(gbm) library(hydroGOF) library(Metrics) data(iris) # Using caret caretGrid <- expand.grid(interaction.depth=c(1, 3, 5), n.trees = (0:50)*50, shrinkage=c(0.01, 0.001), n.minobsinnode=10) metric <- "RMSE" trainControl <- trainControl(method="cv", number=10) set.seed(99) gbm.caret <- train(Sepal.Length ~ ., data=iris, distribution="gaussian", method="gbm", trControl=trainControl, verbose=FALSE, tuneGrid=caretGrid, metric=metric, bag.fraction=0.75) print(gbm.caret) # …

3
设置图形格式:何时适合在折线图下使用填充?
这是一个数据可视化问题-我希望可以在这里提问。 何时适合使用线形图填充时间序列,例如下面的图?(显示一天的ping时间) 我想使用无填充线的普通线更为常见,但是可以使用填充线来实现视觉变化吗? 我对了解有关该主题的任何感知研究或任何样式指南特别感兴趣。

6
用于识别变量之间关系的R包
关闭。这个问题是题外话。它当前不接受答案。 想改善这个问题吗? 更新问题,使它成为交叉验证的主题。 4年前关闭。 是否可以使用R包来探索变量之间是否存在关系? 通常,当我寻找模式时,我会先看相关性,然后看一个方面图。然后,我将一些转换手动应用于数据中的变量。我想知道是否可以通过R包来加快此过程。

2
可视化是否足以转换数据?
问题 我想绘制由30个参数中的每个参数解释的方差,例如绘制为每个参数的条形不同的条形图,以及y轴上的方差: 但是,方差强烈偏向较小的值,包括0,如以下直方图中所示: 如果我通过,则比较容易看出较小值之间的差异(下面的直方图和柱状图):log(x+1)log⁡(x+1)\log(x+1) 题 在对数刻度上绘制是很常见的,但是绘制同样合理吗?log(x+1)log⁡(x+1)\log(x+1)

1
图解线性混合效应模型结果的图
我一直在使用R中的线性混合效果建模来分析一些数据。我打算用结果制作海报,我只是想知道是否有人对混合效果模型有经验,可以建议使用哪些图表来说明结果?模型。我在考虑残差图,拟合值与原始值的图等。 我知道这很大程度上取决于我的数据,但我只是想尝试一种最佳方法来说明线性混合效应模型的结果。我在R中使用nlme软件包。 谢谢



1
如何解释密度图的高度
我应该如何解释密度图的高度: 例如,在上面的图中,峰值在x = 18处约为0.07。我可以推断出大约7%的值在18左右吗?我能比这更具体吗?在x = 30处还有一个第二个峰,高度为0.02。这是否意味着大约2%的值在30左右? 编辑:关于概率分布值超过1的问题可以吗?讨论了> 1的概率值,这在这里根本不是问题。它还讨论了关于朴素贝叶斯分类的问题,这也不是重点。我想用简单的语言从这些密度曲线中得出数值推论。讨论了曲线下面积的作用,但我的问题是具体地,我们可以对存在于曲线上的特定x和y组合得出什么推论。例如,如何在该图上关联x = 30和y = 0.02。关于30和0.02之间的关系,我们可以写什么陈述。因为密度是一个单位值,所以可以说2%的值出现在29.5到30.5之间吗?如果是这样,我们如何解释值是否仅在0到1之间变化,如下图所示: 如果100%的值出现在0和1之间,为什么在0和1之外存在任何曲线? 在x = 0.1到x = 0.2处有一个平坦部分,其中y等于0.8。它形成一个矩形。我们如何找出在x = 0.1和x = 0.2之间出现值的比例 (附言:如果您觉得这个问题有趣/重要,请对其进行投票;)

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.