Questions tagged «measurement»

测量是将值(数字或其他形式)分配给观察值。


4
什么是困惑?
我遇到了术语“ 困惑”,它是指对看不见的数据进行对数平均的逆概率。维基百科关于困惑的文章并没有给出直观的含义。 在pLSA纸中使用了这种困惑度度量。 谁能解释困惑测量的必要性和直观含义?

3
手动计算逻辑回归95%置信区间与在R中使用confint()函数之间为什么会有区别?
亲爱的大家-我注意到我无法解释的怪事,可以吗?总之:在logistic回归模型中计算置信区间的手动方法和R函数confint()得出不同的结果。 我一直在研究Hosmer&Lemeshow的Applied Logistic回归(第二版)。在第3章中,有一个计算比值比和95%置信区间的示例。使用R,我可以轻松地重现模型: Call: glm(formula = dataset$CHD ~ as.factor(dataset$dich.age), family = "binomial") Deviance Residuals: Min 1Q Median 3Q Max -1.734 -0.847 -0.847 0.709 1.549 Coefficients: Estimate Std. Error z value Pr(>|z|) (Intercept) -0.8408 0.2551 -3.296 0.00098 *** as.factor(dataset$dich.age)1 2.0935 0.5285 3.961 7.46e-05 *** --- Signif. codes: 0 ‘***’ 0.001 ‘**’ …
34 r  regression  logistic  confidence-interval  profile-likelihood  correlation  mcmc  error  mixture  measurement  data-augmentation  r  logistic  goodness-of-fit  r  time-series  exponential  descriptive-statistics  average  expected-value  data-visualization  anova  teaching  hypothesis-testing  multivariate-analysis  r  r  mixed-model  clustering  categorical-data  unsupervised-learning  r  logistic  anova  binomial  estimation  variance  expected-value  r  r  anova  mixed-model  multiple-comparisons  repeated-measures  project-management  r  poisson-distribution  control-chart  project-management  regression  residuals  r  distributions  data-visualization  r  unbiased-estimator  kurtosis  expected-value  regression  spss  meta-analysis  r  censoring  regression  classification  data-mining  mixture 

1
如何对齐/同步两个信号?
我正在做一些研究,但是一直停留在分析阶段(应该更多地关注我的统计讲座)。 我收集了两个同时发生的信号:对体积进行积分的流速和对胸部扩张的改变。我想比较这些信号,最终希望从胸部扩张信号中得出体积。但是首先我必须对齐/同步我的数据。 由于记录不是在同一时间开始,并且胸部扩展被捕获的时间更长,因此我需要在胸部扩展数据集中找到与我的体数据相对应的数据,并衡量它们的对齐程度。如果两个信号不是完全同时启动,或者不是在不同比例和不同分辨率的数据之间启动,我不太确定该如何处理。 我已经附上了这两个信号的示例(https://docs.google.com/spreadsheet/ccc?key=0As4oZTKp4RZ3dFRKaktYWEhZLXlFbFVKNmllbGVXNHc),请告诉我是否还有其他信息。

5
有没有衡量传播“均匀性”的方法?
我在网上查找,但找不到任何有用的信息。 我基本上是在寻找一种衡量值的“平均”分配方式的方法。例如,X的“均匀”分布分布: 均值和标准差大致相同的“不均匀”分布Y: 但是,是否有任何均匀性度量m使得m(X)> m(Y)?如果没有,那么创建这种度量的最佳方法是什么? (图片来自可汗学院的屏幕截图)

3
为了得出“天花板效应”正在发生,必须满足什么条件?
根据SAGE社会科学研究方法百科全书 ... [a]上限效应发生在一项措施具有潜在响应的明显上限并且参与者集中度达到或接近该上限时。尺度衰减是一个方法学问题,每当以这种方式限制方差时都会发生。…例如,某种程度的态度可能会产生天花板效应,其中高分表示一种有利态度,而最高的反应却无法捕捉到最积极的评价。…解决天花板效应的最佳解决方案是试点测试,这可以尽早发现问题。如果发现上限效应,并且[结果]度量标准是任务绩效,则可以使任务更加难以增加潜在响应的范围。1个 [重点添加] 似乎有很多的建议和问题,(在这里)处理分析这表明类似于上述报价的天花板埋入影响的数据。 我的问题可能很简单,也可能很幼稚,但是如何真正检测出数据中存在上限效应呢?更具体地说,例如,创建了一个心理测验,并怀疑其导致了上限效应(仅视觉检查),然后对该测验进行了修改,以产生更大范围的值。如何显示修订后的测试已从其生成的数据中消除了上限效应?是否有一项测试表明数据集a中存在上限效应,但数据集b中没有上限效应? 我幼稚的方法是仅检查分布偏斜,如果不偏斜,则得出结论没有上限效应。这太简单了吗? 编辑 再举一个更具体的例子,我说开发了一种可以测量某些潜在特征x的工具,该特征x随着年龄的增长而增加,但最终趋于平稳,并随着年龄的增长而开始下降。我制作了第一个版本,范围为1-14,进行了一些试验,发现似乎有一个上限效应(很多响应在14或接近14时,最大值。)查看数据,但是为什么呢?是否有严格的方法来支持该主张? 然后,我将度量值修改为1-20,并收集更多数据。我看到趋势更加符合我的期望,但是我怎么知道测量范围足够大。我需要再次修改吗?从外观上看,这似乎还可以,但是有没有一种方法可以验证我的怀疑? 我想知道如何才能在数据中检测到这种上限效应,而不仅仅是查看它。这些图代表实际数据,而非理论数据。扩大仪器的范围可以产生更好的数据分布,但这足够吗?我该如何测试? 1 Hessling,R.,Traxel,N.,&Schmidt,T.(2004)。天花板效果。SAGE社会科学研究方法百科全书,由 Michael S. Lewis-Beck,A。Bryman和Tim Futing Liao(编)撰写。(第107页)。加利福尼亚州千橡市:Sage Publications,Inc. doi:10.4135 / 9781412950589.n102

2
经济学家如何量化黑市运作?
我对东亚的有组织犯罪进行了大量研究,目的是为了支持我的一位作者朋友的项目。我注意到,一些著名的经济学家和新闻工作者共同估算了全球黑市运作的价值。 这是什么方法?这些数字如何相加?这些数字是在传统市场模型中捕获的吗?

5
最佳距离测量
语境 我有两组数据要比较。在这两组的每个数据元素是含有22角(所有之间的矢量−π−π-\pi和ππ\pi)。角度与给定的人体姿势配置有关,因此姿势由22个关节角度定义。 我最终想要做的是确定两组数据的“紧密度”。因此,对于一组中的每个姿势(22D矢量),我想在另一组中找到其最近的邻居,并为每个最接近的对创建距离图。 问题 我可以简单地使用欧几里得距离吗? 为了有意义,我假设距离度量需要定义为:θ=|θ1−θ2|modπθ=|θ1−θ2|modπ\theta = |\theta_1 - \theta_2| \quad mod \quad \pi,其中|...||...||...|是绝对值,mod是模。然后使用得到的22个theta,我可以执行标准的欧几里德距离计算,t21+t22+…+t222−−−−−−−−−−−−−−√t12+t22+…+t222\sqrt{t_1^2 + t_2^2 + \ldots + t_{22}^2}。 它是否正确? 另一个距离度量标准(例如卡方或Bhattacharyya或其他度量标准)会更有用吗?如果是这样,请您提供一些原因的见解。

1
衡量工作日内分布的均匀性
我有一个与此问题类似的问题: 如何测量分布的不均匀性? 我在一周中的每一天都有一组概率分布。我想测量每个分布与(1 / 7,1 / 7,...,1/7)的接近程度。 目前,我正在使用上述问题的答案;L2-范数,当分布在一天中的某一天质量为1时,值为1,对于(1 / 7,1 / 7,...,1/7)最小。我线性缩放它,使其在0到1之间,然后将其翻转,使0表示完全不均匀,而1表示完全均匀。 这很好用,但是我有一个问题。它将每个工作日均视为7维空间中的一个维度,因此不考虑天数的接近性;换句话说,即使(1 / 2,1 / 2,0,0,0,0,0)和(1 / 2,0,0,1 / 2,0,0,0)的得分相同尽管从某种意义上说,后者更“分散”和统一,理想情况下应该获得更高的分数。显然增加了复杂性,即天的顺序是循环的。 我该如何改变这种启发式方法来考虑天的临近?

4
在这种情况下,对y的x回归明显好于对y的y吗?
在一个10人的随机样本上监测用于测量人血液中葡萄糖水平的仪器。还可以使用非常准确的实验室程序来测量水平。仪器度量用x表示。实验室程序度量用y表示。 我个人认为x上的y更正确,因为其目的是使用仪器读数来预测实验室读数。x上的y最小化了此类预测的误差。 但是提供的答案是y上的x。

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.