Questions tagged «pdf»

连续随机变量的概率密度函数(PDF)给出了每个可能值的相对概率。将此标签也用于离散概率质量函数(PMF)。

6
概率分布值超过1可以吗?
在有关朴素贝叶斯分类器的Wikipedia页面上,存在以下行: p(height|male)=1.5789p(height|male)=1.5789p(\mathrm{height}|\mathrm{male}) = 1.5789(1的概率分布是可以的。钟形曲线下的面积等于1。) 值如何确定?我认为所有概率值都表示在范围内。此外,假设有可能具有这样的值,那么在页面上显示的示例中如何获得该值?>1>1>10≤p≤10≤p≤10 \leq p \leq 1



3
对数转换的预测变量和/或响应的解释
我想知道是否仅对因变量(无论是因变量还是自变量)还是仅对自变量进行了对数转换,在解释上是否有所不同。 考虑以下情况 log(DV) = Intercept + B1*IV + Error 我可以将IV解释为百分比增长,但是当我拥有 log(DV) = Intercept + B1*log(IV) + Error 或当我有 DV = Intercept + B1*log(IV) + Error ?
46 regression  data-transformation  interpretation  regression-coefficients  logarithm  r  dataset  stata  hypothesis-testing  contingency-tables  hypothesis-testing  statistical-significance  standard-deviation  unbiased-estimator  t-distribution  r  functional-data-analysis  maximum-likelihood  bootstrap  regression  change-point  regression  sas  hypothesis-testing  bayesian  randomness  predictive-models  nonparametric  terminology  parametric  correlation  effect-size  loess  mean  pdf  quantile-function  bioinformatics  regression  terminology  r-squared  pdf  maximum  multivariate-analysis  references  data-visualization  r  pca  r  mixed-model  lme4-nlme  distributions  probability  bayesian  prior  anova  chi-squared  binomial  generalized-linear-model  anova  repeated-measures  t-test  post-hoc  clustering  variance  probability  hypothesis-testing  references  binomial  profile-likelihood  self-study  excel  data-transformation  skewness  distributions  statistical-significance  econometrics  spatial  r  regression  anova  spss  linear-model 


3
CDF是否比PDF更基础?
我的统计专家基本上说过,如果给出以下三个之一,则可以找到其他两个: 累积分布函数 瞬间产生功能 概率密度函数 但是我的计量经济学教授说,CDF比PDF更基础,因为在某些示例中您可以拥有CDF,但未定义PDF。 CDF是否比PDF更基础?我如何知道可以从CDF导出PDF还是MGF?
43 probability  pdf  cdf  mgf 

3
转换变量密度的直观解释?
假设是pdf的随机变量。然后,随机变量具有pdfXXXfX(x)fX(x)f_X(x)Y=X2Y=X2Y=X^2 fY(y)={12y√(fX(y√)+fX(−y√))0y≥0y<0fY(y)={12y(fX(y)+fX(−y))y≥00y<0f_Y(y)=\begin{cases}\frac{1}{2\sqrt{y}}\left(f_X(\sqrt{y})+f_X(-\sqrt{y})\right) & y \ge 0 \\ 0 & y \lt 0\end{cases} 我了解背后的原因。但我正在尝试寻找一种方法来向不了解微积分的人进行解释。特别是,我试图解释为什么出现在前面。我会刺一下它:1y√1y\frac{1}{\sqrt{y}} 假设具有高斯分布。pdf的几乎所有权重都在值之间,例如和但是对于,它映射到0到9 。因此,在将转换为的pdf中,权重已扩展到更大范围的值。因此,为真正的pdf,必须通过乘数来降低额外的权重XXX−3−3-33.3.3.YYYXXXYYYfY(y)fY(y)f_Y(y)1y√1y\frac{1}{\sqrt{y}} 听上去怎么样? 如果有人能提供更好的解释或链接到文档或教科书中的内容,我将不胜感激。我在几本数学概论/统计入门书籍中找到了这个变量转换示例。但是我从来没有找到一个直观的解释:(

4
R?中非负变量密度图的好方法
plot(density(rexp(100)) 显然,左侧所有的密度都表示偏差。 我希望总结一些非统计人员的数据,并且我想避免有关为何非负数据的密度在零左边的问题。这些图用于随机检查;我想按治疗组和对照组显示变量的分布。分布通常是指数级的。由于各种原因,直方图比较棘手。 快速的Google搜索使统计人员可以在非负内核上进行工作,例如: this。 但是,它有没有在R中实现?在已实现的方法中,对于描述性统计,它们中的任何一种是否“最佳”? 编辑:即使from命令可以解决我当前的问题,也很高兴知道是否有人基于非负密度估计的文献实现了内核

10
为什么两个随机变量之和是卷积?
长期以来,我不明白为什么两个随机变量的“和”是它们的卷积,而和的混合密度函数之和是f(x)f(x)f(x)g(x)g(x)g(x)pf(x)+(1−p)g(x)pf(x)+(1−p)g(x)p\,f(x)+(1-p)g(x); 算术和而不是它们的卷积。确切的短语“两个随机变量的总和”在Google中出现了146,000次,并且如下所示是椭圆形的。如果认为RV产生单个值,则可以将该单个值添加到另一个RV单个值,这与卷积无关,至少不是直接相关,所有都是两个数字的和。但是,统计数据中的RV结果是值的集合,因此更精确的短语类似于“来自两个RV的相关个体值对的协调总和的集合是它们的离散卷积”……并且可以通过以下方式近似:对应于那些RV的密度函数的卷积。更简单的语言: 2个RVnnn样本实际上是两个n维向量,它们相加作为向量和。 请详细说明两个随机变量的和如何是卷积和。

2
伽玛与对数正态分布
我有一个实验观察到的分布,看起来与gamma或对数正态分布非常相似。我已经读到对数正态分布是随机变量的最大熵概率分布,其ln (X )的均值和方差是固定的。伽马分布是否具有任何类似的性质?XXXln(X)ln⁡(X)\ln(X)

4
如何确定多元正态分布的分位数(等值线)
我对如何计算多元分布的分位数感兴趣。在图中,我绘制了给定单变量正态分布的5%和95%分位数(左)。对于正确的多元正态分布,我想象一个类似物将是一个等密度线,它包围密度函数的基数。以下是我尝试使用软件包计算此结果的示例mvtnorm-但未成功。我想可以通过计算多元密度函数结果的等值线来做到这一点,但是我想知道是否还有另一种选择(例如,qnorm)。谢谢你的帮助。 例: mu <- 5 sigma <- 2 vals <- seq(-2,12,,100) ds <- dnorm(vals, mean=mu, sd=sigma) plot(vals, ds, t="l") qs <- qnorm(c(0.05, 0.95), mean=mu, sd=sigma) abline(v=qs, col=2, lty=2) #install.packages("mvtnorm") require(mvtnorm) n <- 2 mmu <- rep(mu, n) msigma <- rep(sigma, n) mcov <- diag(msigma^2) mvals <- expand.grid(seq(-2,12,,100), seq(-2,12,,100)) mvds <- …

2
您能用外行的术语解释Parzen窗口(内核)密度估计吗?
Parzen窗口密度估计被描述为 p(x)=1n∑i=1n1h2ϕ(xi−xh)p(x)=1n∑i=1n1h2ϕ(xi−xh) p(x)=\frac{1}{n}\sum_{i=1}^{n} \frac{1}{h^2} \phi \left(\frac{x_i - x}{h} \right) 其中nnn是在向量元素的数目,是一个向量,被的概率密度,是Parzen窗的尺寸,和是窗口函数。xxxp(x)p(x)p(x)xxxhhhϕϕ\phi 我的问题是: Parzen窗口函数和其他密度函数(例如高斯函数)之间的基本区别是什么? 窗口函数()在查找的密度中的作用是什么?ϕϕ\phixxx 为什么我们可以插入其他密度函数来代替窗口函数? 在求密度中的作用是什么?hhhxxx


1
我必须掷骰子几次来自信地评估其公平性?
(事先对使用非专业语言而非统计语言的道歉。) 如果我想以合理的确定性来衡量将特定的物理六面模具的每一侧滚动到大约+/- 2%以内的几率,那么需要多少个示例模具卷? 即我需要掷骰子多少次,计算每个结果,以确保98%确保骰子掷出骰子的几率在14.6%-18.7%之内?(或一些类似的标准,其中大约98%的人会确保骰子的公平性在2%以内。) (这是使用骰子的模拟游戏的现实世界关注点,希望确保某些骰子设计的滚动数字接近1/6的可能性可以接受。有人声称,许多常见的骰子设计被测量为滚动29%1)。每次将几个这样的骰子滚动1000次。)

3
是否有贝叶斯方法进行密度估算
我有兴趣估算连续随机变量的密度。我学到的一种方法是使用内核密度估计。XXX 但是现在,我对遵循以下思路的贝叶斯方法感兴趣。我最初认为服从分配。我采取的读数。有什么方法可以根据我的新读物来更新?XXXFFFnnnXXXFFF 我知道我听起来好像在自相矛盾:如果我只相信是我的先前发行记录,那么没有数据可以说服我。但是,假设是而我的数据点是。看到,我显然不能坚持以前的做法,但是应该如何更新呢?FFFFFFUnif[0,1]Unif[0,1]Unif[0,1](0.3,0.5,0.9,1.7)(0.3,0.5,0.9,1.7)(0.3, 0.5, 0.9, 1.7)1.71.71.7 更新:根据评论中的建议,我开始研究Dirichlet过程。让我使用以下符号: G∼DP(α,H)θi|G∼Gxi|θi∼N(θi,σ2)G∼DP(α,H)θi|G∼Gxi|θi∼N(θi,σ2) G \sim DP(\alpha,H)\\ \theta_i | G \sim G\\ x_i | \theta_i \sim N(\theta_i,\sigma^2) 用这种语言构架了我原来的问题之后,我想我对以下内容感兴趣:。如何做到这一点?θn+1|x1,...,xnθn+1|x1,...,xn\theta_{n+1} | x_1,...,x_n 在这套笔记(第2页)中,作者举了的示例。(Polya方案)。我不确定这是否相关。θn+1|θ1,...,θnθn+1|θ1,...,θn\theta_{n+1} | \theta_1,...,\theta_n 更新2:我也想问(在看到注释之后):人们如何选择DP的?似乎是一个随机选择。另外,人们如何为DP 选择先前的?我应该只使用先验作为先验吗?αα\alphaHHHθθ\thetaHHH

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.