在研究数据挖掘方法时,我已经了解到有两个主要类别:
预测方法:
- 分类
- 回归
描述方法:
- 聚类
- 关联规则
由于我想根据位置,活动,电池电量(培训模型的输入)来预测用户的可用性(输出),因此我认为很明显我会选择“预测方法”,但是现在我似乎无法选择分类和回归。从到目前为止的理解,分类可以解决我的问题,因为输出是“可用”或“不可用”。
分类能否为我提供用户可用或不可用的概率(或可能性)?
在输出中,不仅仅是0(不可用)或1(可用),还可以是:
- 可用
- 不可用
也可以使用回归来解决此问题吗?
我知道回归用于连续输出(不仅是0或1个输出),但是输出不能是用户可用性的连续值(例如输出为表示用户为可用,则用户是无法使用)。