4 有人会因为研究数据不重要而将其遗漏吗? 我在阅读sciencemag.org上的文章时遇到了这句话。 最后,仅包括来自12个国家/地区的7600名研究人员的答复,因为其余数据没有统计学意义。 这是进行研究的正确方法吗?是否要忽略结果,因为它们没有统计学意义? 9 statistical-significance sampling outliers theory
4 如何在2 X 3桌子上进行多个事后卡方检验? 我的数据集包括近海,中海道和近海三种地点类型的生物的总死亡率或生存率。下表中的数字表示站点数。 100% Mortality 100% Survival Inshore 30 31 Midchannel 10 20 Offshore 1 10 我想知道根据地点类型,发生100%死亡率的地点数量是否显着。如果我运行2 x 3卡方,则会得到显着的结果。我是否可以进行事后成对比较,或者实际上应该使用对数方差分析或二项分布的回归?谢谢! 9 logistic multiple-comparisons chi-squared r text-mining clustering classification feature-selection unsupervised-learning time-series references mode hypothesis-testing confidence-interval bootstrap normal-distribution order-statistics correlation statistical-significance spss bayesian beta-binomial
2 5点李克特项目随时间变化的统计意义 内容: 我有两年来同一份问卷中的两个数据集。每个问题均采用5 Likert量表进行评估。 Q1:编码方案 目前,我已将响应编码为[0,1]间隔,其中0表示“最负面的响应”,1表示“最正面的响应”,其他的响应平均间隔。 用于李克特量表的“最佳”编码方案是什么? 我意识到这可能有点主观。 问题2:多年的意义 确定两年内是否存在统计上的重大变化的最佳方法是什么? 也就是说,查看每年问题1的结果,如何判断2011年结果和2010年结果之间的差异是否具有统计显着性?我对学生的t检验在这里的使用有一个模糊的回忆,但我不确定。 9 statistical-significance likert
2 评估相关意义 我有两个变量,可以计算它们之间的皮尔逊相关性,但是我想知道一些类似于t检验会给我的东西(即有关相关性有多重要的一些概念)。 这样的事情存在吗? 9 correlation statistical-significance
2 计算数据的ROC曲线 因此,我进行了16次试验,试图使用汉明距离从生物特征中鉴定一个人。我的阈值设置为3.5。我的数据如下,只有试验1为“真阳性”: Trial Hamming Distance 1 0.34 2 0.37 3 0.34 4 0.29 5 0.55 6 0.47 7 0.47 8 0.32 9 0.39 10 0.45 11 0.42 12 0.37 13 0.66 14 0.39 15 0.44 16 0.39 我的困惑是,我真的不确定如何根据此数据制作ROC曲线(FPR与TPR或FAR与FRR)。哪一个都不重要,但是我只是对如何进行计算感到困惑。任何帮助,将不胜感激。 9 mathematical-statistics roc classification cross-validation pac-learning r anova survival hazard machine-learning data-mining hypothesis-testing regression random-variable non-independent normal-distribution approximation central-limit-theorem interpolation splines distributions kernel-smoothing r data-visualization ggplot2 distributions binomial random-variable poisson-distribution simulation kalman-filter regression lasso regularization lme4-nlme model-selection aic r mcmc dlm particle-filter r panel-data multilevel-analysis model-selection entropy graphical-model r distributions quantiles qq-plot svm matlab regression lasso regularization entropy inference r distributions dataset algorithms matrix-decomposition regression modeling interaction regularization expected-value exponential gamma-distribution mcmc gibbs probability self-study normality-assumption naive-bayes bayes-optimal-classifier standard-deviation classification optimization control-chart engineering-statistics regression lasso regularization regression references lasso regularization elastic-net r distributions aggregation clustering algorithms regression correlation modeling distributions time-series standard-deviation goodness-of-fit hypothesis-testing statistical-significance sample binary-data estimation random-variable interpolation distributions probability chi-squared predictor outliers regression modeling interaction