深度学习中的体重和偏见是什么?


16

我开始从Tensorflow网站学习机器学习。对于深度学习程序遵循的流程,我已经有了非常基本的了解(这种方法使我可以快速学习,而不必阅读书籍和大型文章)。

我遇到了一些令人困惑的事情,其中​​两个是:

  1. 偏压
  2. 重量

在tensorflow网站上的MNIST教程中,他们提到我们需要偏见和权重才能找到图像中存在特定图案的证据。我不明白的是,在何处以及如何确定“偏差”和“权重”的值?

我们是否必须提供这些值,或者TensorFlow库是否基于训练数据集自动计算这些值?

另外,如果您可以提供一些有关如何加快我的深度学习速度的建议,那就太好了!

Tensorflow初学者教程


3
作为参数一的统计模型,他们了解到估计通过最小化损失函数依赖于你的数据。这就是机器学习的全部内容。如果您遵循这种教学方法,您将会问很多问题。我建议像在Coursera上那样学习MOOC,这样您就可以以明智的顺序学习事物。
艾姆雷(Emre)

这是非常基础的,因此您应该像建议的那样进行类似@Emre的课程。
HelloWorld

Answers:


11

从数学上讲。想象一下你是一个模特(不,不是那种,图8)

偏压只是您的偏见,现在您是尼日利亚人,而您被问到“哪个国籍的女人最美丽”,您说尼日利亚女士,我们可以说这是因为您有偏见。所以你的公式是ÿ=w ^X+ñ一世GË[R一世一种ñ

那你懂什么?有偏见的是,像您这样的模型中的预先假设。

至于权重,从逻辑上讲,权重是您的梯度(线性代数中的a),

什么是渐变?,这是线性函数的陡度。

是什么使线性梯度非常陡峭(高正值)?

这是因为X(输入)的微小变化会导致Y轴(输出)的较大差异。因此,您(不再是模型,而是一位出色的数学家(您的自我))或您的计算机尝试找到此梯度,您可以将其称为权重。不同之处在于,您使用铅笔和图形书来查找此内容,但黑匣子通过寄存器进行电子魔术。

在机器学习过程中,计算机或您尝试在数据点上绘制许多直线或线性函数,

为什么您尝试绘制许多直线?

因为在您的图形书/计算机存储器中,您正在尝试查看合适的行。

我或计算机如何知道合适的线?

在我的中学里,我被教导要在数据点上画一条线,目视检查在所有数据点中间完美切入的线(忘记那些AI炒作,我们的大脑可以通过盯着事物来计算) 。但是对于计算机,它会尝试每条线向数据点的标准偏差和方差。选择偏差最小的行(有时将其称为误差函数)。

凉!那么,会发生什么

计算该线的梯度,可以说是计算学习问题的权重

多数民众赞成在机器学习的基本理解和他/她的Graphbook中的高中学生绘图图


10

我同意您对课程的看法,您应该看一门课程,也许是Andrew Ng的Coursera机器学习,这是一门备受推崇的免费入门课程。这是关于机器学习基础的一个基本问题。因此,我不会在此答案中涵盖数学,因此您可以从很多地方获得该知识,包括该课程。

在何处以及如何确定“偏差”和“权重”的值?

权重和偏差是模型的可学习参数。除神经网络外,它们在线性回归等相关模型中也以相同的名称出现。大多数机器学习算法都包含一些这样的可学习参数。

在学习开始之前,这些参数的值是随机初始化的(这将使它们全部收敛为单个值)。然后,在训练过程中提供数据时,会将它们调整为具有正确输出的值。

我们是否必须提供这些值,或者TensorFlow库是否基于训练数据集自动计算这些值?

尽管您可能想决定诸如应该有多少个参数(在由每一层的大小控制的神经网络中)之类的事情,但是您不需要在训练之前提供值。TensorFlow在训练期间会自动计算值。如果您已经有一个训练过的模型并想重新使用它,那么您将需要直接设置值,例如通过从文件中加载它们。

处理本教程中权重和偏差的更改的特定代码是这样的:

train_step = tf.train.GradientDescentOptimizer(0.5).minimize(cross_entropy)

还有这个:

sess.run(train_step, feed_dict={x: batch_xs, y_: batch_ys})

第一行定义权重和值的更改方式。您几乎可以将其理解为“定义使用梯度下降优化器来减少所提供数据的交叉熵的训练函数”。

第二行使用特定的数据段调用该函数。每次运行第二条线时,都会调整权重和偏差值,以便神经网络输出ÿ 每个值都更接近正确的关联 X 值。


8

重量 -重量是连接的强度。如果我增加输入,那么它将对输出产生多少影响。

权重接近零意味着更改此输入不会更改输出。许多算法会自动将这些权重设置为零,以简化网络。

偏差 -表示我们的预测与实际价值相差多远。通常,参数化算法具有较高的偏差,使其学习速度更快,更易于理解,但灵活性通常较低。反过来,对于无法满足算法偏差的简化假设的复杂问题,它们的预测性能较低。

低偏差建议对目标函数的形式进行更多假设。

高偏差建议减少有关目标函数形式的假设。


2
OP正在询问神经网络中的偏差参数。您对偏见的定义还可以,但是请不要回答这个问题。
尼尔·斯莱特
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.