我了解从系统发育数据中导出协方差矩阵,以使要进行回归的两个变量的。但是,如果您有一个连续变量(先前已证明依赖于系统发育)和一个序数变量,会发生什么?后者是序数,我不确定如何将其与系统发育依赖性导致测试统计数据偏倚的方式联系起来。
在连续变量上计算费尔森斯坦的系统发生独立对比度并将其用于方差分析是否有意义?
PIC值为:
其中是物种是物种,并且是系统树上物种和之间的成对距离。 X i ,X j X j d i j i j
我了解从系统发育数据中导出协方差矩阵,以使要进行回归的两个变量的。但是,如果您有一个连续变量(先前已证明依赖于系统发育)和一个序数变量,会发生什么?后者是序数,我不确定如何将其与系统发育依赖性导致测试统计数据偏倚的方式联系起来。
在连续变量上计算费尔森斯坦的系统发生独立对比度并将其用于方差分析是否有意义?
PIC值为:
其中是物种是物种,并且是系统树上物种和之间的成对距离。 X i ,X j X j d i j i j
Answers:
我建议的第一步是为每个序数类引入一个虚拟变量(请参见https://www.google.com/url?sa=t&source=web&rct=j&ei=B9r5U67pH8vfsASwq4GADQ&url=http://www.uta的注释).edu / faculty / kunovich / Soci5304_Handouts / Topic%25208_Dummy%2520Variables.doc&cd = 2&ved = 0CCAQFjAB&usg = AFQjCNEX-TD7RjSYZ-ej32_5tgPTxVVdvQ&sig2 = 9hkDU6Y2mpKcGzBT的变量均值分析和回归分析。您还可以测试虚拟变量本身的趋势。如果这样做有先验的理由(查看当前数据),您还可以根据虚拟变量各自估计的大小对顺序变量类别进行重新排序,以进行后续分析。
假设先前的分析缺少趋势效应的增加(不一定是线性的),并且在序数变量本身中包含了任何可支持的排序,那么一种有趣的方法(也要解决可能的正态性问题)是进行回归分析,在该分析中将所有变量分配给等级,包括序数变量。从Wikipedia引用Spearman的等级相关系数(链接:http ://en.m.wikipedia.org/wiki/Spearman的s_rank_correlation_coefficient)可以得出这种疯狂的理由:
“像任何相关计算一样,斯皮尔曼系数既适用于连续变量也适用于离散变量,包括序数变量。[1] [2]”
维基百科提供了一个示例和几种方法来评估所计算的等级相关性的标准误差以进行测试。注意,如果它在统计上不与零不同,那么像基于等级的计算回归中一样,缩放版本也不重要。
我将进一步对这些等级进行归一化(除以观察数),给出可能的样本分位数解释(请注意,在构建所讨论数据的经验分布时可能会有改进)。我还将在y和给定的已转换序数变量之间执行简单的相关性,以便您选择的排名的方向(例如1到4与4到1)为等级相关生成一个符号,该符号在上下文中具有直观的含义你的学习。
[编辑]请注意,ANOVA模型可以使用适当的设计矩阵以回归格式表示,并且无论您研究的是哪种标准回归模型,中心主题都是对给定X的Y进行均值分析。但是,在某些学科(例如生态学,事实证明,对包括中位数在内的各种分位数所隐含的回归关系的不同关注已取得成果。显然,在生态学中,平均效应可能很小,但在其他分位数上却不一定如此。此字段称为分位数回归。我建议您使用它来补充当前的分析。作为参考,您可能会发现SAS研究所的Colin(Lin)Chen的论文213-30,“分位数回归和QUANTREG过程简介”很有帮助。
这也是使用秩变换的来源:Ronald L. Iman和WJ Conover撰写的“回归中的秩变换的使用”,发表于1979年11月,第21卷,第4期,Technometrics。本文指出,回归使用秩变换似乎在单调数据上工作得很好。在线杂志上指出的可靠性专业人员也对此观点表示赞同:“秩回归估计方法对于可以线性化的函数非常有用”。资料来源:“可靠性热线,第10期,2010年12月。