我们如何向没有统计学背景的受众解释逻辑回归和神经网络之间的区别?
我们如何向没有统计学背景的受众解释逻辑回归和神经网络之间的区别?
Answers:
我假设您正在考虑过去的问题,在关于神经网络的问题中也许仍被称为“多层感知器”。如果是这样的话,我将根据决策变量的形式灵活地解释决策边界的形式。特别地,对于此受众,我不会提及链接函数/对数赔率等。仅需保持这样的想法,即根据某些观察来预测事件的概率。
这是一个可能的顺序:
这种方法的优点是您不必真正地掌握任何数学细节即可给出正确的想法。实际上,他们不必了解逻辑回归或神经网络就可以了解它们的异同。
这种方法的缺点是您必须制作大量图片,并且强烈抵制诱惑以代数解释事物的诱惑。
我要从字面上回答这个问题:没有统计学背景的人。而且我不会尝试给该人提供统计学背景。例如,假设您必须向公司的首席执行官或类似人员解释差异。
So: Logistic regression is a tool for modeling a categorical variable in terms of other variables. It gives you ways to find out how changes in each of the "other" variables affects the odds of different outcomes in the first variable. The output is fairly easy to interpret.
Neural networks are a set of methods to let a computer try to learn from examples in ways that vaguely resemble how humans learn about things. It may result in models that are good predictors, but they are usually much more opaque than those from logistic regression.
I was taught that you can think of neural networks (with logistic activation functions) as as a weighted average of logit functions, with the weights themselves estimated. By choosing a large number of logits, you can fit any functional form. There's some graphical intuition in the Econometric Sense blog post.
The other answers are great. I would simply add some pictures showing that you can think of logistic regression and multi-class logistic regression (a.k.a. maxent, multinomial logistic regression, softmax regression, maximum entropy classifier) as a special architecture of neural networks.
来自密歇根州立大学塞巴斯蒂安·拉施卡(Sebastian Raschka)的KDnuggets:
有关多类逻辑回归的其他一些示例:
类似的插图摘自http://www.deeplearningbook.org/第1章:
还有TensorFlow教程中的另外一个:
我将举一个听众理解的复杂但具体问题的例子。使用其解释未经训练但具有特殊含义的隐藏节点。
如果您使用国际象棋位置(预测白棋是否会获胜),则可以让输入代表棋盘(忽略您是否可以掩盖或俘获过客,甚至是自己的举动),例如 二进制输入,指示每个正方形上是否存在每种类型的片段。
线性回归确定在h4上拥有一个白色骑士有多好。可能一点都不好看,但是如果是在h4上,就没有被捕获,这可能超过了其他考虑。线性回归可能会恢复棋子的粗略值,最好将棋子放在棋盘中心,并在对手的棋盘一侧。线性回归无法评估组合,例如,如果相反的国王在a1上,则b2上的皇后突然变得更有价值。
神经网络可能具有用于概念的隐藏节点,例如“物质优势”,“黑王安全”,“中心控制”,“ d文件中的两个小白菜”,“孤立的大白菜小卒”或“主教”流动性。” 其中一些可以仅通过电路板的输入进行估算,而其他一些则可能必须位于第二层或更高的隐藏层中。神经网络可以将其用作位置最终评估的输入。这些概念可以帮助专家评估位置,因此,与线性回归相比,神经网络应该能够进行更准确的评估。但是,由于必须选择神经网络的结构并且需要训练的参数很多,因此创建神经网络需要花费更多的工作。