Questions tagged «quantiles»

分布的分位数指的是其累积分布函数上的点。一些常见的分位数是四分位数和百分位数。

1
使用百分位数作为预测变量-好主意吗?
我正在考虑一个问题,该问题是使用线性回归来预测客户的对数(支出)。 我正在考虑将哪些功能用作输入,并想知道将变量的百分位数用作输入是否可以。 例如,我可以将公司收入用作输入。我想知道的是,我是否可以使用公司收入百分比来代替。 另一个示例是分类行业分类器(NAICS)-如果我要查看每个NAICS代码的中位数支出,然后将每个NAICS代码分配给一个“ NAICS百分位数”,那将是我可以使用的有效解释变量吗? 只想知道使用百分位数时是否有任何需要注意的问题?它在某种程度上等同于一种要素缩放吗?

1
有没有一种方法可以只估计分位数来估计分布参数?
如果只给几个分位数,有没有一种方法可以拟合指定的分布? 例如,如果我告诉您我有一个伽玛分布数据集,则经验的 20%,30%,50%和90%分位数分别是: 20% 30% 50% 90% 0.3936833 0.4890963 0.6751703 1.3404074 我将如何估算参数?有多种方法可以做到这一点,还是已经有一个特定的程序? 更多编辑:我没有特别要求伽玛分布,这只是一个例子,因为我担心我无法适当地解释我的问题。我的任务是给定一些(2-4)个分位数,并希望估计一些分布的(1-3)参数尽可能“接近”。有时候有一个(或无限)精确的解决方案,有时却没有,对吧?

2
测试组之间(某些)分位数Q的差异?
对于某些分为三个组(X)的Y变量,我希望对各组进行比较,并假设所有三个组之间90%的分位数相同。我可以使用哪些测试? 我能想到的一种选择是使用分位数回归,还有其他选择/方法吗? 我想如果我想比较中位数,就可以使用kruskal wallis检验(尽管它是基于等级的,但是如果我没记错的话,当残差分布是对称的时,它也会给出相同的结果) 谢谢。

2
计算数据的ROC曲线
因此,我进行了16次试验,试图使用汉明距离从生物特征中鉴定一个人。我的阈值设置为3.5。我的数据如下,只有试验1为“真阳性”: Trial Hamming Distance 1 0.34 2 0.37 3 0.34 4 0.29 5 0.55 6 0.47 7 0.47 8 0.32 9 0.39 10 0.45 11 0.42 12 0.37 13 0.66 14 0.39 15 0.44 16 0.39 我的困惑是,我真的不确定如何根据此数据制作ROC曲线(FPR与TPR或FAR与FRR)。哪一个都不重要,但是我只是对如何进行计算感到困惑。任何帮助,将不胜感激。
9 mathematical-statistics  roc  classification  cross-validation  pac-learning  r  anova  survival  hazard  machine-learning  data-mining  hypothesis-testing  regression  random-variable  non-independent  normal-distribution  approximation  central-limit-theorem  interpolation  splines  distributions  kernel-smoothing  r  data-visualization  ggplot2  distributions  binomial  random-variable  poisson-distribution  simulation  kalman-filter  regression  lasso  regularization  lme4-nlme  model-selection  aic  r  mcmc  dlm  particle-filter  r  panel-data  multilevel-analysis  model-selection  entropy  graphical-model  r  distributions  quantiles  qq-plot  svm  matlab  regression  lasso  regularization  entropy  inference  r  distributions  dataset  algorithms  matrix-decomposition  regression  modeling  interaction  regularization  expected-value  exponential  gamma-distribution  mcmc  gibbs  probability  self-study  normality-assumption  naive-bayes  bayes-optimal-classifier  standard-deviation  classification  optimization  control-chart  engineering-statistics  regression  lasso  regularization  regression  references  lasso  regularization  elastic-net  r  distributions  aggregation  clustering  algorithms  regression  correlation  modeling  distributions  time-series  standard-deviation  goodness-of-fit  hypothesis-testing  statistical-significance  sample  binary-data  estimation  random-variable  interpolation  distributions  probability  chi-squared  predictor  outliers  regression  modeling  interaction 
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.