Questions tagged «maximum»

极值是样本中最大或最小的观测值;例如,样本最小值(一阶统计量)和样本最大值(n阶统计量)。与极值相关的是渐近*极值分布*。

3
对数转换的预测变量和/或响应的解释
我想知道是否仅对因变量(无论是因变量还是自变量)还是仅对自变量进行了对数转换,在解释上是否有所不同。 考虑以下情况 log(DV) = Intercept + B1*IV + Error 我可以将IV解释为百分比增长,但是当我拥有 log(DV) = Intercept + B1*log(IV) + Error 或当我有 DV = Intercept + B1*log(IV) + Error ?
46 regression  data-transformation  interpretation  regression-coefficients  logarithm  r  dataset  stata  hypothesis-testing  contingency-tables  hypothesis-testing  statistical-significance  standard-deviation  unbiased-estimator  t-distribution  r  functional-data-analysis  maximum-likelihood  bootstrap  regression  change-point  regression  sas  hypothesis-testing  bayesian  randomness  predictive-models  nonparametric  terminology  parametric  correlation  effect-size  loess  mean  pdf  quantile-function  bioinformatics  regression  terminology  r-squared  pdf  maximum  multivariate-analysis  references  data-visualization  r  pca  r  mixed-model  lme4-nlme  distributions  probability  bayesian  prior  anova  chi-squared  binomial  generalized-linear-model  anova  repeated-measures  t-test  post-hoc  clustering  variance  probability  hypothesis-testing  references  binomial  profile-likelihood  self-study  excel  data-transformation  skewness  distributions  statistical-significance  econometrics  spatial  r  regression  anova  spss  linear-model 


3
破碎的棍子最大碎片的分布(间距)
随机将长度为均匀地分成片段。最长片段的长度分布是什么?k+1k+1k+1 更正式地说,让为IID,让为关联的订单统计信息,即我们简单地订购以这样的方式来处理样本。令。(U1,…Uk)(U1,…Uk)(U_1, \ldots U_k)U(0,1)U(0,1)U(0,1)(U(1),…,U(k))(U(1),…,U(k))(U_{(1)}, \ldots, U_{(k)})U(1)≤U(2)≤,…,≤U(k)U(1)≤U(2)≤,…,≤U(k)U_{(1)} \leq U_{(2)} \leq, \ldots , \leq U_{(k)}žķ= 最大(U(1 ),U(2 )− U(1 ),… ,U(k)−U(k−1),1−U(k))Zk=max(U(1),U(2)−U(1),…,U(k)−U(k−1),1−U(k))Z_k = \max \left(U_{(1)}, U_{(2)}-U_{(1)}, \ldots, U_{(k)} - U_{(k-1)}, 1-U_{(k)}\right) 我对Z_k的分布感兴趣ZkZkZ_k。矩,渐近结果或k \ uparrow \ infty的近似值k↑∞k↑∞k \uparrow \infty也很有趣。

2
我们如何限制随机变量最大的概率?
\newcommand{\P}{\mathbb{P}}假设我们有NNN独立的随机变量X1X1X_1,……\ldots,XnXnX_n具有有限的均值μ1≤…≤μNμ1≤…≤μN\mu_1 \leq \ldots \leq \mu_N和方差σ21σ12\sigma_1^2,……\ldots,σ2NσN2\sigma_N^2。我正在寻找任意Xi≠XNXi≠XNX_i \neq X_N大于所有其他XjXjX_j,j \ neq i的概率的无分布边界j≠ij≠ij \neq i。 换句话说,如果为了简单起见,我们假设X_i的分布XiXiX_i是连续的(使得P(Xi=Xj)=0P(Xi=Xj)=0\P(X_i = X_j) = 0),那么我正在寻找 P(Xi=maxjXj).P(Xi=maxjXj). \P( X_i = \max_j X_j ) \enspace. 如果N=2N=2N=2,我们可以使用切比雪夫不等式得到: P(X1=maxjXj)=P(X1>X2)≤σ21+σ22σ21+σ22+(μ1−μ2)2.P(X1=maxjXj)=P(X1>X2)≤σ12+σ22σ12+σ22+(μ1−μ2)2. \P(X_1 = \max_j X_j) = \P(X_1 > X_2) \leq \frac{\sigma_1^2 + \sigma_2^2}{\sigma_1^2 + \sigma_2^2 + (\mu_1 - \mu_2)^2} \enspace. 我想找到一般N的一些简单(不一定紧)边界NNN,但是我无法找到(美学上)一般N的令人满意的结果NNN。 请注意,这些变量不假定为iid。欢迎对相关工作提出任何建议或参考。 更新:回想一下,假设μj≥μiμj≥μi\mu_j \geq …

4
边缘情况下精度和召回率的正确值是多少?
精度定义为: p = true positives / (true positives + false positives) 对不对,作为true positives和false positives做法0,精度接近1? 召回相同的问题: r = true positives / (true positives + false negatives) 我目前正在实施统计测试,需要计算这些值,有时分母为0,我想知道在这种情况下应返回哪个值。 PS:请原谅,不恰当的标签,我想用recall,precision和limit,但我不能创造新的标签呢。
20 precision-recall  data-visualization  logarithm  references  r  networks  data-visualization  standard-deviation  probability  binomial  negative-binomial  r  categorical-data  aggregation  plyr  survival  python  regression  r  t-test  bayesian  logistic  data-transformation  confidence-interval  t-test  interpretation  distributions  data-visualization  pca  genetics  r  finance  maximum  probability  standard-deviation  probability  r  information-theory  references  computational-statistics  computing  references  engineering-statistics  t-test  hypothesis-testing  independence  definition  r  censoring  negative-binomial  poisson-distribution  variance  mixed-model  correlation  intraclass-correlation  aggregation  interpretation  effect-size  hypothesis-testing  goodness-of-fit  normality-assumption  small-sample  distributions  regression  normality-assumption  t-test  anova  confidence-interval  z-statistic  finance  hypothesis-testing  mean  model-selection  information-geometry  bayesian  frequentist  terminology  type-i-and-ii-errors  cross-validation  smoothing  splines  data-transformation  normality-assumption  variance-stabilizing  r  spss  stata  python  correlation  logistic  logit  link-function  regression  predictor  pca  factor-analysis  r  bayesian  maximum-likelihood  mcmc  conditional-probability  statistical-significance  chi-squared  proportion  estimation  error  shrinkage  application  steins-phenomenon 


1
使用样条线查找密度函数的局部极值
我正在尝试找到概率密度函数的局部最大值(使用R density方法找到)。由于存在大量数据,因此我无法执行一种简单的“环顾四周”方法(即环顾一个点以查看其是否是相对于其邻居的局部最大值)。此外,与使用容错和其他参数构建“环顾四周”相反,使用样条插值法然后找到一阶导数的根似乎更为有效和通用。 所以,我的问题是: 给定来自的函数splinefun,哪些方法可以找到局部最大值? 有没有一种简单/标准的方法来查找使用返回的函数的派生形式splinefun? 有没有更好的/标准的方法来找到概率密度函数的局部最大值? 供参考,以下是我的密度函数图。我正在使用的其他密度函数在形式上相似。我应该说我是R的新手,但不是编程的新手,因此可能会有一个标准的库或程序包来实现我所需要的。 谢谢你的帮助!!
15 r  pdf  splines  maximum 

1
插入符glmnet与cv.glmnet
在glmnet内部caret使用搜索最佳lambda和cv.glmnet执行相同任务的比较中似乎有很多困惑。 提出了许多问题,例如: 分类模型train.glmnet与cv.glmnet? 在插入符号中使用glmnet的正确方法是什么? 使用`caret`交叉验证`glmnet` 但是没有给出答案,这可能是由于问题的可重复性。在第一个问题之后,我给出了一个非常相似的示例,但确实存在相同的问题:为什么估计的lambda如此不同? library(caret) library(glmnet) set.seed(849) training <- twoClassSim(50, linearVars = 2) set.seed(849) testing <- twoClassSim(500, linearVars = 2) trainX <- training[, -ncol(training)] testX <- testing[, -ncol(testing)] trainY <- training$Class # Using glmnet to directly perform CV set.seed(849) cvob1=cv.glmnet(x=as.matrix(trainX),y=trainY,family="binomial",alpha=1, type.measure="auc", nfolds = 3,lambda = seq(0.001,0.1,by = 0.001),standardize=FALSE) …

2
样本最大值的方差是多少?
我正在寻找一组随机变量的最大值的方差的界限。换句话说,我想找的闭合形式的公式乙BB,使得 其中 X = { X 1,... ,X 中号 }是一组固定的中号与有限装置的随机变量 μ 1,... ,μ 中号和方差 σ 2 1,... ,σ 2 中号。瓦尔(最大一世X一世)≤ 乙,Var(maxiXi)≤B, \mbox{Var}(\max_i X_i) \leq B \enspace, X= { X1个,… ,X中号}X={X1,…,XM}X = \{ X_1, \ldots, X_M \}中号MMμ1个,… ,μ中号μ1,…,μM\mu_1, \ldots, \mu_Mσ21个,… ,σ2中号σ12,…,σM2\sigma_1^2, \ldots, \sigma_M^2 我可以推断出 但是这个界限似乎很松散。数值试验似乎表明,乙= 最大值我σ 2 我可能是一种可能性,但我一直没能证明这一点。任何帮助表示赞赏。瓦尔(最大一世X一世)≤ Σ一世σ2一世,Var(maxiXi)≤∑iσi2, \mbox{Var}(\max_i X_i) …

3
有没有人比今天的Usain Bolt快?
编辑:我对给定样本统计量的给定总体中确定“真实”最大值的可能性的技术问题和方法更感兴趣。从创纪录的短跑时间来估算比博尔特先生更快的跑动者的可能性是显而易见的,这是显而易见的。通过想象并非如此来嘲笑我。 Usain Bolt是最快跑出100m的人。但是,鉴于运动员的数量很少,看来“真正的”最快的人还活着坐在某个地方的沙发上,从未尝试过竞争性的跑步生涯。 我试图利用这样一个事实,即正态分布尾部的样本之间的差异越来越小。我正在使用它通过将Usain与第二快,第三快等进行比较,来计算存在比Usain Bolt更快的人的可能性。 为此,我试图通过将正态分布的CDF相对于的导数计算出来,从而将“ Usain Bolt”之外的最大值计算出来,将其yyy提高到第nnn个(其中nnn约为7,000,000,000或样本小于“最大值”-其背后的逻辑在“ 德国坦克问题维基百科”页面中进行了描述,该页面概括了不同分布之间的关系,例如: ∫∞0yfYN(y)dy=λn∫∞0y[12[1+erf(y−μσ2√)]]n−112πσ2√e−(y−μ)22σ2dy∫0∞yfYN(y)dy=λn∫0∞y[12[1+erf⁡(y−μσ2)]]n−112πσ2e−(y−μ)22σ2dy\int_{0}^{\infty}y f_{Y_N} (y)dy = \lambda n \int_{0}^{\infty} y \left [ \tfrac12\left[1 + \operatorname{erf}\left( \frac{y-\mu}{\sigma\sqrt{2}}\right)\right] \right ]^{n-1} \frac{1}{\sqrt{2\pi\sigma^2}}\, e^{-\frac{(y - \mu)^2}{2 \sigma^2}}dy 这是一种计算存在某人的概率比Usain Bolt更快的有效方法吗? 在“其他分布的德国坦克问题”之外,这种问题是否有名称? 有没有一种很好的方法可以从分布的极端样本估计标准偏差?查找有关有史以来最快的1亿个破折号的信息很容易,很难找到平均值和方差) 感谢您耐心与没有背景知识的程序员打交道。


2
虚假相关的期望值
我们独立于正态分布绘制NNN样本,每个样本的大小为。(μ ,σ 2)nnn(μ,σ2)(μ,σ2)(\mu,\sigma^2) 然后,从样本中选择彼此具有最高(绝对)Pearson相关性的2个样本。NNN 这种相关性的期望值是多少? 谢谢[PS这不是作业]

1
n iid个正态变量最大比的期望值
假设是 iid,并且表示的第个最小元素。怎样才能使两个连续元素之间的比率的预期最大值达到上限?也就是说,如何计算上限:X1,...,XnX1,...,XnX_1,...,X_nN(μ,σ2)N(μ,σ2)N(\mu,\sigma^2)X(i)X(i)X_{(i)}iiiX1,...,XnX1,...,XnX_1,...,X_nX(i)X(i)X_{(i)} E[maxi=1,...,n−1(X(i+1)X(i))]E[maxi=1,...,n−1(X(i+1)X(i))]E\left[\max\limits_{i=1,...,n-1}\left(\frac{X_{(i+1)}}{X_{(i)}}\right)\right] 我能够找到的文献主要集中在两个随机变量之间的比率上,这导致了比率分布,此处给出了两个不相关的正态分布的pdf:https : //en.wikipedia.org/wiki/ Ratio_distribution#Gaussian_ratio_distribution。虽然这将使我能够提高nnn变量的预期平均比率的上限,但我看不到如何将这一概念推广到nnn变量的预期最大比率。


2
最大化艾德高斯派的最有力结果是什么?在实践中最常用?
由于X1,…,Xn,…∼N(0,1)X1,…,Xn,…∼N(0,1)X_1, \ldots, X_n, \ldots \sim \mathscr{N}(0,1) IID,考虑随机变量 Zn:=max1≤i≤nXi.Zn:=max1≤i≤nXi. Z_n := \max_{1 \le i \le n} X_i\,. 问题:这些随机变量最“重要”的结果是什么? 为了澄清“重要性”,哪个结果具有其他大多数这样的结果是合乎逻辑的结果?在实践中最常使用哪个结果? 更具体地说,似乎是(理论上的)统计学家之间的民俗知识,即至少渐近地“基本上与”。(请参阅此相关问题。)ZnZnZ_n2logn−−−−−√2log⁡n\sqrt{2 \log n} 但是,这种类型的结果有很多,而且似乎大多数情况不是等效的,也不是相互暗示的。例如∗∗^*, Zn2logn−−−−−√→a.s.1,(1)(1)Zn2log⁡n→a.s.1, \frac{Z_n}{\sqrt{2 \log n}} \overset{a.s.}{\to} 1 \,, \tag{1} 如果没有别的,也暗示了概率和分布的相应结果。 但是,它甚至似乎并不暗示也有相关的结果(请参见另一个问题),例如 limn→∞EZn2logn−−−−−√=1,(2)(2)limn→∞EZn2log⁡n=1, \lim_{n \to \infty} \frac{\mathbb{E}Z_n}{\sqrt{2 \log n}} =1 \,, \tag{2} (这是第49页的练习2.17 ),或另一个民俗结果:††\dagger EZn=2logn−−−−−√+Θ(1).(3)(3)EZn=2log⁡n+Θ(1). \mathbb{E}Z_n = \sqrt{2 \log n} …

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.