Questions tagged «r»

对于(a)涉及“ R”作为问题的关键部分或预期答案的任何* on-topic *问题,请使用此标签;&(b)关于如何使用“ R”并非“正当”。

2
R:动态更新图表
关闭。这个问题是题外话。它当前不接受答案。 想改善这个问题吗? 更新问题,使它成为交叉验证的主题。 8个月前关闭。 这是一个数据可视化问题。我有一个数据库,其中包含一些不断修改的数据(在线更新)。R中每隔5或10秒更新图表的最佳方法是什么?(无需再次绘制所有内容就可以了)? 红


2
计算数据的ROC曲线
因此,我进行了16次试验,试图使用汉明距离从生物特征中鉴定一个人。我的阈值设置为3.5。我的数据如下,只有试验1为“真阳性”: Trial Hamming Distance 1 0.34 2 0.37 3 0.34 4 0.29 5 0.55 6 0.47 7 0.47 8 0.32 9 0.39 10 0.45 11 0.42 12 0.37 13 0.66 14 0.39 15 0.44 16 0.39 我的困惑是,我真的不确定如何根据此数据制作ROC曲线(FPR与TPR或FAR与FRR)。哪一个都不重要,但是我只是对如何进行计算感到困惑。任何帮助,将不胜感激。
9 mathematical-statistics  roc  classification  cross-validation  pac-learning  r  anova  survival  hazard  machine-learning  data-mining  hypothesis-testing  regression  random-variable  non-independent  normal-distribution  approximation  central-limit-theorem  interpolation  splines  distributions  kernel-smoothing  r  data-visualization  ggplot2  distributions  binomial  random-variable  poisson-distribution  simulation  kalman-filter  regression  lasso  regularization  lme4-nlme  model-selection  aic  r  mcmc  dlm  particle-filter  r  panel-data  multilevel-analysis  model-selection  entropy  graphical-model  r  distributions  quantiles  qq-plot  svm  matlab  regression  lasso  regularization  entropy  inference  r  distributions  dataset  algorithms  matrix-decomposition  regression  modeling  interaction  regularization  expected-value  exponential  gamma-distribution  mcmc  gibbs  probability  self-study  normality-assumption  naive-bayes  bayes-optimal-classifier  standard-deviation  classification  optimization  control-chart  engineering-statistics  regression  lasso  regularization  regression  references  lasso  regularization  elastic-net  r  distributions  aggregation  clustering  algorithms  regression  correlation  modeling  distributions  time-series  standard-deviation  goodness-of-fit  hypothesis-testing  statistical-significance  sample  binary-data  estimation  random-variable  interpolation  distributions  probability  chi-squared  predictor  outliers  regression  modeling  interaction 


2
我可以使用置换测试来避免比例背景下的多重比较问题吗?
我正在评估5种不同方法预测特定二进制结果(称为“成功”和“失败”)的有效性。数据如下所示: Method Sample_Size Success Percent_Success 1 28 4 0.14 2 19 4 0.21 3 24 7 0.29 4 21 13 0.61 5 22 9 0.40 我想对这5种方法进行测试,以评估这些方法的相对优势。换句话说,我想按照性能的顺序对方法进行排序,方法是方法1>方法2> ...方法5。为避免出现多个比较的问题,我计划按照以下几行进行置换测试: 步骤1:汇总所有数据,以使总样本量为114,共获得37次成功。 步骤2:将数据随机分为5组,相应的样本大小分别为28、19、24、21和22。 步骤3:如果从步骤2中观察到的Percent_Success顺序与我的数据顺序一致,则增加一个计数器。 步骤4:重复步骤2和3多次(例如10000)。 所需的p值=最终计数器值/ 10000。 问题: 以上程序可以吗? R中有什么可以让我执行上述测试的吗? 任何改进或替代方法的建议都会有所帮助。

4
多向非参数方差分析
我必须分析具有​​五个因子(其中一个嵌套在另一个因子中)和数值响应的析因设计。我想执行非参数方差分析,但是我当然不能同时使用Kruskall Wallis检验和Friedman检验(我已经复制了测度)。R中是否有可以帮助我的命令或代码?谢谢!Stefania


2
如何在R中垂直堆叠具有相同x比例但不同y比例的两个图?
问候, 目前,我正在R中执行以下操作: require(zoo) data <- read.csv(file="summary.csv",sep=",",head=TRUE) cum = zoo(data$dcomp, as.Date(data$date)) data = zoo(data$compressed, as.Date(data$date)) data <- aggregate(data, identity, tail, 1) cum <- aggregate(cum, identity, sum, 1) days = seq(start(data), end(data), "day") data2 = na.locf(merge(data, zoo(,days))) plot(data2,xlab='',ylab='compressed bytes',col=rgb(0.18,0.34,0.55)) lines(cum,type="h",col=rgb(0,0.5,0)) summary.csv的片段: date,revision,file,lines,nclass,nattr,nrel,bytes,compressed,diff,dcomp 2007-07-25,16,model.xml,96,11,22,5,4035,991,0,0 2007-07-27,17,model.xml,115,16,26,6,4740,1056,53,777 2007-08-09,18,model.xml,106,16,26,7,4966,1136,47,761 2007-08-10,19,model.xml,106,16,26,7,4968,1150,4,202 2007-09-06,81,model.xml,111,16,26,7,5110,1167,13,258 ... 最后两行绘制了我需要的信息,其结果类似于以下内容: 蓝线是我感兴趣的工件的熵(以字节为单位)。绿线代表变化的熵。 现在,在此图中,它的效果很好,因为比例没有太大差异。但是我还有其他图表,其中的绿线变得很小,一个人看不到。 我正在寻找的解决方案涉及两件事: …

1
如何测量人群图片中的人数?
背景:以色列(以及整个中东)充满了抗议活动。 我很好奇,当得到一张照片时,估计其中有多少人(通常是一大群人的照片)。 哪种建模可以为该问题提供一些解决方案?(当然,可以使用任何开源程序包来完成。比如,R?)
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.