功能和标签有什么区别?


100

我正在关注有关机器学习基础的教程,并且提到某些东西可以是功能标签

据我所知,功能是正在使用的数据的属性。我不知道标签是什么,我知道单词的含义,但是我想知道它在机器学习的上下文中的含义。


功能是用作输入的字段,标签是用作输出的字段。举一个简单的例子,考虑如何根据汽车的行驶里程,年份等来预测是否应该出售汽车。标签是/否是标签,而里程和年份将是特征。
amcneil206

Answers:


200

简要地,特征是输入;标签输出。这适用于分类和回归问题。

功能是输入集中数据的一列。例如,如果您要预测某人会选择的宠物的类型,则您的输入功能可能包括年龄,居住地区,家庭收入等。标签是最终的选择,例如狗,鱼,鬣蜥,石头,等等

训练完模型后,您将为其提供包含这些功能的一组新输入。它将返回该人的预测“标签”(宠物类型)。


1
因此,[年龄,家庭地区,家庭收入]将是“ 3个特征向量”。在Keras中,用于LSTM网络的NumPy数组为[样本,时间步长3]?
naisanza

1
@naisanza:那肯定是一种可能性。我对Keras并不熟悉,但是这个高级组织肯定是有效实施的开始。
西梅

功能和变量是同一回事吗?
Debadatta '18

我想指出的是,“标签”也取决于上下文。例如,对于训练模型,您将使用“标记”数据。在这种情况下,标签是与您的输出数据进行比较的基本事实。
阿塔纳索夫(N.Atanasov)'18年

哇。很好的答案,谢谢您,清除了有关此主题空间的许多遗留问题。
安德鲁·雷

31

特征:

机器学习中的功能意味着您的训练数据的属性。或者,您可以在训练数据集中说出列名。

假设这是您的训练数据集

Height   Sex   Age
 61.5     M     20
 55.5     F     30
 64.5     M     41
 55.5     F     51
 .     .     .
 .     .     .
 .     .     .
 .     .     .

然后,这里HeightSexAge的功能。

标签:

训练后从模型获得的输出称为标签。

假设你供给上述数据集以某种算法,并产生一个模型来预测性别作为男性或女性,在传递功能,如上述模型ageheight

因此,计算后,它将返回性别为Male或Female。那就是标签


5

这里有一个更直观的方法来解释这个概念。假设您要对照片中显示的动物进行分类。

可能的动物类别是例如猫或鸟。在这种情况下,标签将是您的机器学习算法将预测的可能的类别关联,例如猫或鸟。

功能是图案,颜色,那是你的图像如弗尔,羽毛,或更低水平解释,像素值的一部分的形式。

鸟 标签:鸟类
特征:羽毛

猫

标签:
特点:毛茸茸


5

让我们举一个例子,我们要使用手写照片检测字母。我们将这些样本图像提供给程序,然后程序根据它们获得的功能对这些图像进行分类。

在这种情况下,特征的一个例子是:字母'C'可以被认为是凹面朝右的。

现在出现有关如何存储这些功能的问题。我们需要命名它们。这就是标签的作用。一个标签是考虑到这样的功能,以区别其他功能他们。

因此,当提供特征作为输入时,我们获得标签作为输出

标签与无监督学习有关。


4

先决条件:基本统计数据和ML(线性回归)暴露

可以用一句话来回答-

它们相似,但是其定义根据需要而改变。

说明

让我解释一下我的发言。假设您有一个数据集,为此请考虑exercise.csv。数据集中的每一列称为要素。性别,年龄,身高,心率,身体温度和卡路里可能是各个列之一。每列代表不同的功能或特性。

exercise.csv

User_ID  Gender Age  Height  Weight Duration    Heart_Rate  Body_Temp   Calories
14733363 male   68  190.0   94.0    29.0           105.0    40.8        231.0
14861698 female 20  166.0   60.0    14.0            94.0    40.3        66.0
11179863 male   69  179.0   79.0    5.0             88.0    38.7        26.0

为了巩固理解并弄清难题,我们来解决两个不同的问题(预测案例)。

案例1:在这种情况下,我们可以考虑使用-性别,身高和体重来预测运动中燃烧的卡路里。此处的预测卡路里Label卡路里是您要使用-x1:性别,x2:高度和x3:重量等各种功能预测的列。

情况2:在第二种情况下,我们可能希望通过使用性别和体重作为特征来预测Heart_rate。这里Heart_Rate是使用特征-x1 :性别和x2:重量预测的标签

了解了以上说明后,您就不会再对标签和功能感到困惑了。


3

简要说明的功能将是您输入到系统的输入,标签将是您期望的输出。例如,您已经喂食了狗的许多特征,例如狗的身高,皮毛颜色等,因此在计算之后,它将返回您想知道的狗的品种。


0

假设您要预测气候,那么赋予您的功能将是历史气候数据,当前天气,温度,风速等,而标签将是几个月。上面的组合可以帮助您得出预测。

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.