是否需要分类或回归来预测给定某些功能的用户的可用性?


9

在研究数据挖掘方法时,我已经了解到有两个主要类别:

  • 预测方法:

    • 分类
    • 回归
  • 描述方法:

    • 聚类
    • 关联规则

由于我想根据位置,活动,电池电量(培训模型的输入)来预测用户的可用性(输出),因此我认为很明显我会选择“预测方法”,但是现在我似乎无法选择分类和回归。从到目前为止的理解,分类可以解决我的问题,因为输出是“可用”或“不可用”。

分类能否为我提供用户可用或不可用的概率(或可能性)?

在输出中,不仅仅是0(不可用)或1(可用),还可以是:

  • 80%可用
  • 20%不可用

也可以使用回归来解决此问题吗?

我知道回归用于连续输出(不仅是0或1个输出),但是输出不能是用户可用性的连续值(例如输出为表示用户为可用,则用户是无法使用)。8080%20%

Answers:


6
  1. 是。例如,流行的softmax回归可为您提供每个类别的概率分布。
  2. 是。Softmax是对一组离散类的回归。

我们可以使用回归进行分类,最常见的策略是获取最可能的类别进行预测。


1

是的,您可以根据您的输出要求使用分类或回归,

如果要标记输出,如可用或不可用,则应使用分类。

如果要以可用性百分比的形式输出,则应使用回归。


您可以使用某处的资源来备份吗?
神话

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.