统计和大数据 continuous-data

将范围数据视为连续数据时的最佳做法

我正在查看丰度是否与大小有关。大小（当然）是连续的，但是，以这样的规模记录了丰度： A = 0-10 B = 11-25 C = 26-50 D = 51-100 E = 101-250 F = 251-500 G = 501-1000 H = 1001-2500 I = 2501-5000 J = 5001-10,000 etc... A至Q ... 17级。我在想一种可能的方法是给每个字母分配一个数字：最小，最大或中位数（即A = 5，B = 18，C = 38，D = 75.5 ...）。潜在的陷阱是什么？因此，将这些数据视为分类会更好吗？我已经阅读了这个问题，提供了一些想法-但此数据集的关键之一是类别不均匀-因此将其视为类别将假定A和B之间的差异与A之间的差异相同B和C ...（可以通过使用对数进行纠正-感谢Anonymouse）最终，在考虑其他环境因素之后，我想看看是否可以将大小用作丰度的预测指标。预测也将在一个范围内：给定大小X以及因子A，B和C，我们预测丰度Y会介于最小和最大之间（我想这可能跨越一个或多个尺度点：大于最小D而小于最大F ...虽然越精确越好）。

9 categorical-data variance model continuous-data

随机效应可以仅应用于分类变量吗？

这个问题听起来可能很愚蠢，但是... 随机效应仅适用于分类变量（例如个体ID，人口ID等）是正确的吗，例如说是分类变量：X一世X一世x_i ÿ一世ÿ一世y_i〜βX一世βX一世\beta_{x_i} βX一世βX一世\beta_{x_i}〜ñø ř 米（μ ，δ2）ñØ[R米（μ，δ2）Norm(\mu, \delta^2) 但是根据原理，随机效应不能应用于连续变量（例如高度，质量...），例如：ž一世ž一世z_i ÿ一世ÿ一世y_i〜α + β⋅ž一世α+β⋅ž一世\alpha + \beta \cdot z_{i} 因为只有一个系数不能约束？听起来合乎逻辑，但我想知道为什么统计文献中从未提及它！谢谢！ββ\beta 编辑：但是如果我约束像〜？那是随机效应吗？但这与我对施加的约束不同-在这里，我约束变量，而在前面的示例中，我约束了系数！对我来说，它开始看起来像是一团糟。。。不管怎么说，放这个约束没有多大意义，因为是已知值，所以也许这个想法很奇怪:-)ž一世ž一世z_iž一世ž一世z_iñø ř 米（μ ，δ2）ñØ[R米（μ，δ2）Norm(\mu, \delta^2)βX一世βX一世\beta_{x_i}ž一世ž一世z_i

9 mixed-model categorical-data continuous-data random-effects-model

Questions tagged «continuous-data»