Answers:
由于您提出了一个非常基本的问题,因此似乎值得指定机器学习本身。
机器学习是一类由数据驱动的算法,即与“常规”算法不同的是,数据“说明”了“好答案”。示例:假设的用于图像中人脸检测的非机器学习算法将尝试定义人脸(皮肤圆形的彩色圆盘,期望眼睛的区域较暗,等等)。机器学习算法没有这样的编码定义,但是会“通过示例学习”:您将显示几张面孔和非面孔的图像,并且一个好的算法最终将学习并能够预测是否看不见图像是一张脸。
这个特定的人脸检测示例受到监督,这意味着您的示例必须标记为,或明确指出哪些是面部,哪些不是。
在无监督算法中,您的示例未标记为,即您什么也没说。当然,在这种情况下,算法本身不能“发明”一张脸是什么,但是它可以尝试将数据聚类为不同的组,例如,它可以区分出脸与风景有很大不同,而风景与马有很大不同。
由于另一个答案提到了它(尽管以错误的方式):存在“中间”形式的监督,即半监督和主动学习。从技术上讲,这些是受监督的方法,其中有些“智能”方法可以避免使用大量带标签的示例。在主动学习中,算法本身决定应该标记的东西(例如,可以很确定地识别风景和马匹,但是它可能会要求您确认大猩猩是否确实是一张脸的图片)。在半监督学习中,有两种不同的算法,从带标签的示例开始,然后以他们对大量未标签数据的思考方式相互“讲述”。他们从这种“讨论”中学习。
监督学习是指为算法提供的数据经过“标记”或“标记”时,可以帮助您的逻辑做出决策。
示例:贝叶斯垃圾邮件过滤,您必须将某个项目标记为垃圾邮件以优化结果。
无监督学习是尝试寻找关联而没有原始数据以外的任何外部输入的算法类型。
示例:数据挖掘聚类算法。
例如,训练神经网络经常是有监督的学习:您是在告诉网络与要馈入的特征向量相对应的类别。
聚类是无监督学习:让算法决定如何将样本分组为具有共同属性的类。
无监督学习的另一个例子是Kohonen的自组织图。
我可以举个例子。
假设您需要识别哪种车辆是汽车,哪种车辆是摩托车。
在监督下学习情况下,您的输入(训练)数据集需要标记,即对于输入(训练)数据集中的每个输入元素,应指定它代表的是汽车还是摩托车。
在无监督学习的情况下,您不标记输入。无监督模型基于例如相似的特征/属性将输入聚类为聚类。因此,在这种情况下,没有像“汽车”这样的标签。
监督学习
监督学习基于训练来自数据源的数据样本,其中已经分配了正确的分类。此类技术用于前馈或多层感知器(MLP)模型中。这些MLP具有三个鲜明的特征:
这些特征以及通过培训获得的学习解决了各种难题。通过在有监督的ANN模型中进行训练来学习,也称为错误反向传播算法。纠错学习算法基于输入输出样本来训练网络,并找到误差信号,该误差信号是计算出的输出与所需输出的差,并调整与误差乘积成比例的神经元的突触权重。信号和突触权重的输入实例。基于此原理,错误反向传播学习分两步进行:
前向通行证:
在这里,输入向量被呈现给网络。该输入信号向前传播,由神经元通过网络传播,并作为输出信号出现在网络的输出端:y(n) = φ(v(n))
其中,v(n)
是由定义的神经元的感应局部场。v(n) =Σ w(n)y(n).
在输出层o(n)上计算出的输出为与所需的响应进行比较,d(n)
并找到该e(n)
神经元的错误。在此过程中,网络的突触权重保持不变。
后退通行证:
起源于该层输出神经元的错误信号通过网络向后传播。这将计算每一层中每个神经元的局部梯度,并允许网络的突触权重根据增量规则进行更改,如下所示:
Δw(n) = η * δ(n) * y(n).
递归计算将继续进行,每个输入模式的前向遍历,然后是后向遍历,直到网络收敛为止。
人工神经网络的监督学习范例非常有效,可以找到一些线性和非线性问题的解决方案,例如分类,工厂控制,预测,预测,机器人等。
无监督学习
自组织神经网络使用无监督学习算法进行学习,以识别未标记输入数据中的隐藏模式。这种无人监督是指在不提供错误信号来评估潜在解决方案的情况下学习和组织信息的能力。在无监督学习中缺少学习算法的方向有时可能是有利的,因为它使算法可以回顾以前未曾考虑过的模式。自组织图(SOM)的主要特征是:
计算层也称为竞争层,因为该层中的神经元相互竞争以变得活跃。因此,该学习算法称为竞争算法。SOM中的无监督算法分为三个阶段:
比赛阶段:
对于每个输入模式 x
呈现给网络的,w
计算具有突触权重的内积,并且竞争层中的神经元找到判别函数,该判别函数会诱导神经元之间的竞争,并且突触权重向量在欧几里德距离内接近输入向量被宣布为比赛的冠军。该神经元被称为最佳匹配神经元,
i.e. x = arg min ║x - w║.
合作阶段:
获胜的神经元确定拓扑邻域的中心 h
协作神经元。这是通过d
协作神经元之间的横向相互作用来完成的。该拓扑邻域会在一段时间内减小其大小。
适应阶段:
通过适当的突触权重调整,使获胜的神经元及其附近的神经元相对于输入模式增加其判别功能的各个值,
Δw = ηh(x)(x –w).
在重复呈现训练模式时,由于邻域更新,突触权重向量趋向于遵循输入模式的分布,因此ANN在没有主管的情况下学习。
自组织模型自然地代表了神经生物学行为,因此可用于许多实际应用中,例如聚类,语音识别,纹理分割,矢量编码等。
我一直发现,无监督学习和无监督学习之间的区别是任意的,有些令人困惑。两种情况之间没有真正的区别,相反,在一定范围内,算法可以具有或多或少的“监督”。半监督学习的存在就是明显的例子,这条线是模糊的。
我倾向于将监督视为对算法的反馈,指出应该采用哪种解决方案。对于传统的监督设置(例如垃圾邮件检测),您告诉算法“不要在训练集上犯任何错误”;对于传统的无监督设置(例如聚类),您告诉算法“彼此靠近的点应在同一聚类中”。碰巧的是,第一种反馈形式比后者更具体。
简而言之,当有人说“有监督”时,请思考分类,而当他们说“无监督”时,请考虑聚类,并尽量不要为此担心太多。
机器学习: 它研究和学习可以从数据中学习并进行数据预测的算法。这类算法通过从示例输入中构建模型来进行操作,以便将数据驱动的预测或决策表达为输出,而不是严格遵循静态程序说明。
监督学习: 这是从标记的训练数据中推断功能的机器学习任务,训练数据由一组训练示例组成。在监督学习中,每个示例都是一对,由输入对象(通常是矢量)和期望的输出值(也称为监督信号)组成。监督学习算法分析训练数据并产生一个推断函数,该函数可用于映射新示例。
呈现给计算机的样例输入及其期望的输出(由“老师”给出),目标是学习将输入映射到输出的通用规则。具体地说,监督学习算法采用一组已知的输入数据和已知的响应数据(输出),并训练模型以生成对新数据响应的合理预测。
无监督学习: 这是没有老师的学习。您可能希望对数据进行处理的一件事是将其可视化。机器学习的任务是从未标记的数据推断出描述隐藏结构的功能。由于提供给学习者的示例是未标记的,因此没有错误或奖励信号可以评估潜在的解决方案。这将无监督学习与有监督学习区分开来。无监督学习使用尝试查找模式自然划分的过程。
在无监督学习的情况下,没有基于预测结果的反馈,即没有老师纠正您。在无监督学习方法下,没有提供带标签的示例,并且在学习过程中没有输出的概念。结果,取决于学习方案/模型来找到模式或发现输入数据的组
当您需要大量数据来训练模型,实验和探索的意愿和能力时,应该使用无监督学习方法,当然,通过更成熟的方法也无法很好地解决挑战。与监督学习相比,可以学习更大,更复杂的模型。这是一个很好的例子
。
有监督的学习:比如说一个孩子去幼儿园。老师给他看了3个玩具屋,球和汽车。现在老师给了他10个玩具。他将根据他以前的经验将它们分为3盒房屋,球和汽车。因此,kid首先是在老师的指导下进行指导的,目的是为了获得正确答案。然后他在未知玩具上接受了测试。
无监督学习:再次以幼儿园为例。给孩子一个10个玩具。他被告知将类似的人细分。因此,根据形状,大小,颜色,功能等特征,他将尝试将3个组说成A,B,C并将其分组。
监督一词指的是对机器进行监督/指示,以帮助机器找到答案。一旦学习了说明,就可以轻松预测新情况。
无监督意味着没有监督或指示如何找到答案/标签,并且机器将使用其智能来在我们的数据中查找某种模式。在这里它不会做出预测,只会尝试查找具有相似数据的聚类。
神经网络的学习算法可以是有监督的,也可以是无监督的。
如果已经知道所需的输出,则据说神经网络学习监督。示例:模式关联
无监督学习的神经网络没有这样的目标输出。无法确定学习过程的结果是什么样。在学习过程中,根据给定的输入值,将这种神经网络的单位(权重值)“安排”在一定范围内。目标是在值范围的某些区域将相似的单位组合在一起。示例:模式分类
监督学习
在这种情况下,用于训练网络的每个输入模式都与一个输出模式相关联,该输出模式是目标或所需模式。当在网络的计算输出与正确的预期输出之间进行比较以确定错误时,假定在学习过程中有教师在场。然后可以使用该错误更改网络参数,从而提高性能。
无监督学习
在这种学习方法中,目标输出不会呈现给网络。好像没有老师演示所需的模式,因此,系统通过发现并适应输入模式中的结构特征来学习自己的模式。
有监督的学习:您已经标记了数据并且必须从中学习。例如房屋数据以及价格,然后学习预测价格
无监督学习:您必须先找到趋势然后进行预测,而无需给出任何预先的标签。例如,班上有不同的人,然后有一个新的人来,那么这个新学生属于哪个组。
在监督学习中我们知道输入和输出应该是什么。例如,给定一组汽车。我们必须找出哪些是红色的,哪些是蓝色的。
鉴于无监督学习是我们必须找出答案的地方,很少或根本不知道输出的方式。例如,学习者可能能够构建模型,该模型基于面部表情和诸如“您在微笑什么?”之类的词语的相关性来检测人们何时在微笑。
在简单 监督学习中中,机器学习问题属于一种类型,其中我们具有一些标签,并且通过使用这些标签,我们可以实现诸如回归和分类之类的算法。在输出类似于0或1,真/假,是/否。并应用回归,将实际价值(例如价格之家)放出来
无监督学习是一种机器学习问题,其中我们没有任何标签意味着我们只有一些数据,非结构化数据,并且我们必须使用各种无监督算法对数据进行聚类(数据分组)
监督机器学习
“从训练数据集中学习算法并预测输出的过程。”
预测输出的准确性与训练数据(长度)成正比
监督学习是您具有输入变量(x)(训练数据集)和输出变量(Y)(测试数据集)的地方,并且您使用算法来学习从输入到输出的映射函数。
Y = f(X)
主要类型:
算法:
分类算法:
Neural Networks
Naïve Bayes classifiers
Fisher linear discriminant
KNN
Decision Tree
Super Vector Machines
预测算法:
Nearest neighbor
Linear Regression,Multi Regression
应用领域:
语音识别
预测HR是否选择特定候选人
预测股市价格
监督学习:
监督学习算法分析训练数据并产生一个推断函数,该函数可用于映射新示例。
问题类别:
回归: 预测连续输出中的结果=>将输入变量映射到某个连续函数。
例:
给定一个人的照片,预测他的年龄
分类:预测离散输出的结果=>将输入变量映射为离散类别
例:
这是癌癌吗?
无监督学习:
无监督学习从尚未标记,分类或分类的测试数据中学习。无监督学习可识别数据中的共性,并根据每个新数据中是否存在此类共性做出反应。
我们可以通过基于数据中变量之间的关系对数据进行聚类来得出此结构。
没有基于预测结果的反馈。
问题类别:
聚类:将一组对象进行分组的任务是,使同一组(称为簇)中的对象彼此之间(在某种意义上)比其他组(聚类)中的对象更相似(在某种意义上)
例:
收集1,000,000个不同的基因,并找到一种方法,将这些基因自动分组为通过不同变量(例如寿命,位置,角色等)在某种程度上相似或相关的组。
此处列出了常用的用例。
参考文献:
监督学习
监督学习是我们知道原始输入的输出的地方,也就是说,对数据进行标记,以便在机器学习模型的训练期间它将了解需要在给定输出中检测到的内容,并将在训练期间指导系统进行以下操作:在此基础上检测预先标记的对象,它将检测我们在训练中提供的类似对象。
在这里,算法将知道什么是数据的结构和模式。监督学习用于分类
例如,我们可以有一个形状为正方形,圆形,三角形的不同对象,我们的任务是排列相同类型的形状,使标记的数据集具有所有标记的形状,然后我们将在该数据集上训练机器学习模型。根据训练日期集,它将开始检测形状。
无监督学习
无监督学习是一种无指导的学习,其最终结果未知,它将对数据集进行聚类,并根据对象的相似属性将对象划分为不同的束并检测对象。
在这里,算法将在原始数据中搜索不同的模式,并以此为基础对数据进行聚类。无监督学习用于聚类。
例如,我们可以有多个形状分别为正方形,圆形,三角形的对象,因此它将根据对象属性创建束,如果一个对象具有四个侧面,则将其视为正方形,如果三个侧面具有三角形和如果没有比圆更宽的面,则此处的数据未标记,它将学习以检测各种形状