“虚拟变量”和“指示变量”是标签常用术语,用于描述使用0/1编码的类别中的成员资格;通常为0:不属于类别成员; 1:属于类别成员。
2014年11月26日,对Scholar.google.com(带引号)进行了快速搜索,发现约有318,000篇文章使用了“虚拟变量”,而约112,000篇文章中使用了“指标变量”。术语“虚拟变量”在“ 绑定变量 ”的非统计数学中也具有含义,这很可能有助于在索引文章中更多地使用“虚拟变量”。
我的局部关联问题:
- 这些术语是否始终是同义词(在统计范围内)?
- 这些术语中的任何一个是否曾经被接受地应用于其他形式的分类编码(例如,效果编码,Helmert编码等)?
- 有什么统计学或学科原因比一个术语更喜欢一个术语?
我认为您的意思是性别可能被编码为1或0,性别则要复杂得多。(为此,性也可能更加复杂);)
—
Alexis
记分良好,编辑为
—
Gregor-恢复莫妮卡2014年
sex
。
我倾向于称这样的指标变量
—
Maarten Buis 2014年
male
,其中1表示true(在这种情况下为男性),0表示false(在这种情况下为女性)。如果使用变量名sex
,则每次返回该数据集时,我都必须查找该变量的编码方式。
我听到过各种关于“虚拟变量”的故事,不幸的是,这些故事被非技术人员误解为暗示不屑或贬低。他们令人尴尬和令人信服,足以使我反对该术语。在我看来,“指标”是明确而直接的。
—
尼克·考克斯
male
用1
或编码0
。如果存在一个具有两个以上类别的类别变量,然后将其扩展为每个级别的成员资格的指标变量,我将使用“虚拟变量”来描述那组指标变量。