Questions tagged «machine-learning»

有关计算机算法的问题,这些算法会自动发现数据中的模式并根据这些模式做出正确的决策。

1
谁创造了“机器学习”一词?
我试图找出谁创造了“机器学习”一词。一个辅助问题是从1959年引用亚瑟·塞缪尔(Arthur Samuel)在哪里定义“机器学习”的领域为: 使计算机无需明确编程即可学习的研究领域 ? 在Internet上可以找到很多对此定义的引用,但是我一直无法找到源。有人将其作为他在1959年发表的关于棋子的论文,但我在那里没有找到任何这样的定义。

3
线分隔两组点
是否有办法确定两条点是否可以用一条线分开? 我们有两套分的和是否有分开的线路和,使得所有的点,只有上线的一侧,所有的点,只有在另一边。B A B A A B B一种AA乙BB一种AA乙BB一种AA一种AA乙BB乙BB 我想到的最幼稚的算法是为和构建凸多边形,并测试它们的交集。看起来时间像构造凸多边形一样,其时间复杂度应为。实际上,我不希望时间复杂度有任何改善,我不确定它是否可以改善。但是,至少应该有一种更漂亮的方法来确定是否有这样一条线。B O (n log h )一种AA乙BBØ (ñ 日志h )O(nlog⁡h)O(n\log h)

1
有效地计算或近似神经网络的VC维
我的目标是解决以下问题,该问题已由其输入和输出描述: 输入: 一个有节点,源和宿的有向无环图()。GGGmmmnnn111m>n≥1m>n≥1m > n \geq 1 输出: 具有拓扑的神经网络的VC维(或其近似值)。GGG 更多细节: 中的每个节点都是一个S型神经元。拓扑是固定的,但是边缘的权重可以通过学习算法来改变。GGG 学习算法是固定的(例如向后传播)。 所述源节点是输入神经元和只能坐从串{ - 1 ,1 } Ñ作为输入。ññn{ - 1 ,1 }ñ{-1个,1个}ñ\{-1,1\}^n 接收器节点是输出单元。它输出从实际值,我们四舍五入到1或向下- 1如果它是大于某一固定阈值δ远离0。[ - 1 ,1 ][-1个,1个][-1,1]1个1个1− 1-1个-1δδ\delta000 天真的方法只是试图通过尝试在这些点上训练网络来打破越来越多的点。但是,这种模拟方法效率不高。 题 有没有一种有效的方法来计算此函数(例如,在更改为决策问题:VC维度小于输入参数k吗?)?如果不是,是否有硬度结果?PP\mathsf{P}ķķk 有没有一种行之有效的方法来计算或近似该函数?如果是近似值,是否可以保证其准确性? 笔记 我对stats.SE 提出了类似的问题,但没有引起任何兴趣。

1
感知器可以忘记吗?
我想建立一个基于网络的在线机器学习系统,用户可以在其中连续添加分类的样本,并在线更新模型。我想使用感知器或类似的在线学习算法。 但是,用户可能会犯错误并插入不相关的示例。在那种情况下,我想选择删除一个特定的示例,而无需对整个示例集(可能很大)上的感知器进行重新训练。 这可能吗?

2
神经网络必须始终收敛吗?
介绍 步骤1 我编写了一个标准的反向传播神经网络,为了对其进行测试,我决定将其映射为XOR。 这是一个2-2-1网络(具有tanh激活功能) X1 M1 O1 X2 M2 B1 B2 为了进行测试,我手动将顶部中层神经元(M1)设置为AND门,将下层神经元(M2)设置为OR门(如果为true,则输出1;如果为false,则输出-1)。 现在,我还手动将连接M1-O1设置为-.5,将M2-O1设置为1,将B2设置为-.75 因此,如果M1 = 1且M2 = 1,则总和为(-0.5 +1 -0.75 = -.25)tanh(0.25)= -0.24 如果M1 = -1和M2 = 1,则总和为((-0.5)*(-1)+1 -0.75 = .75)tanh(0.75)= 0.63 如果M1 = -1和M2 = -1,则总和为((-0.5)*(-1)-1 -0.75 = -1.25)tanh(1.25)= -0.8 对于“第一次迭代”来说,这是一个相对较好的结果。 第二步 然后,我对这些权重进行了一些修改,然后使用误差传播算法(基于梯度下降)对它们进行训练。在此阶段,我保持输入神经元和中间神经元之间的权重不变,只是修改中间(和偏差)与输出之间的权重。 为了进行测试,我将权重设置为和.5 .4 .3(分别针对M1,M2和偏差) 但是,在这里,我开始遇到问题。 我的问题 我将学习率设置为0.2,然后让程序遍历训练数据(ABA …

1
评价书面规则体系的方法
我试图提出一种系统,该系统将评估组织的章程以确定其基本逻辑。 我认为一阶谓词系统可以代表规则,可以通过词性标记和其他NLP技术将其从文本中翻译出来。 是否有系统的方法来整体解释一阶逻辑规则,或某种类型的ML体系结构作为第二层来查找元素之间的相似性。 例如, 有趣的活动清单: 高尔夫球 咖啡时间(休闲时光 比萨 按照法律规定: 在星期五,我们打高尔夫球 在星期五或星期六,我们休息一会,如果是星期六,我们吃披萨 结论:我们小组在周末玩得开心 听起来很牵强,但我很好奇是否可行。我还意识到,也许更多的一阶逻辑将更适合驱动第二层的结论。

4
如何设计出建议可行烹饪食谱的算法?
我的课程中曾经有一位资深人士,他创建了一种算法,可以建议烹饪食谱。首先,各种疯狂的食谱都会出现。然后,她将用真实的食谱训练烹饪算法,并最终提出非常好的食谱。 我相信她使用了与贝叶斯定理或聚类有关的东西,但是她早已不复存在,算法也是如此。我已经在互联网上搜索过,但是寻找烹饪食谱会产生任何结果,但不是我想要的结果。所以,我的问题是: 可以使用哪些技术来设计(随机地)提出可行配方的算法(不使用固定配方的数据库)? 为什么我要寻找烹饪算法呢?好吧,这是真实世界中底层概念应用的一个很好的例子,这种算法在更接近真实世界的不同设置中很有用。

6
在一个间隔中找到两个数字的最大异或:我们能做得比二次更好吗?
lllrrrmax(i⊕j)max(i⊕j)\max{(i\oplus j)}l≤i,j≤rl≤i,j≤rl\le i,\,j\le r 天真的算法只检查所有可能的对。例如在红宝石中,我们有: def max_xor(l, r) max = 0 (l..r).each do |i| (i..r).each do |j| if (i ^ j > max) max = i ^ j end end end max end 我感觉到,我们可以做得比二次。是否有针对此问题的更好算法?

2
玩四的机器学习算法连接
我目前正在阅读有关机器学习的文章,并想知道如何将其应用于玩Connect Four。 我目前的尝试是使用S型函数模型和“一对多”方法的简单多类分类器。 在我看来,输入要素必须是7x6 = 42网格字段的状态(播放器1的光盘,播放器2的光盘为空)。 输出将是放入光盘的行数。因为这是1到7之间的离散数字,所以我认为可以将其视为多类分类问题。 但是,如何生成可用于监督学习的培训示例? 主要目标是赢得比赛,但是除了最后一回合,每次比赛的结局显然都不为人所知。如果我只让两个随机决定做什么的玩家互相对抗数千次,那么简单地将每一轮胜利者的所有回合作为训练示例就足够了吗?还是我必须以完全不同的方式来做到这一点? 编辑:根据评论中的建议,我读了一些关于强化学习的知识。 据我所知,Q-Learning应该可以解决问题,即我必须近似当前状态的函数Q,并采取行动使其成为从该状态开始的最大累积奖励。然后,每个步骤将是选择导致Q最大值的动作。但是,此游戏有太多状态要执行此操作,例如作为查找表。那么,对这个Q函数建模的有效方法是什么?

4
机器学习中相关性与因果关系是什么?
众所周知,“关联不等于因果关系”,但是机器学习似乎几乎完全基于关联。我正在使用一个系统,根据学生过去的表现来评估学生对问题的表现。与其他任务(例如Google搜索)不同的是,这似乎不是一种容易玩的系统-因此,因果关系在这方面并不重要。 显然,如果我们想做实验以优化系统,我们将不得不考虑相关性/因果关系的区别。但是,从仅构建一个系统来选择可能具有适当难度级别的问题的角度来看,这种区别是否重要?

1
朴素贝叶斯模型中的平滑
朴素贝叶斯预测器使用以下公式进行预测: P(Y=y|X=x)=αP(Y=y)∏iP(Xi=xi|Y=y)P(Y=y|X=x)=αP(Y=y)∏iP(Xi=xi|Y=y)P(Y=y|X=x) = \alpha P(Y=y)\prod_i P(X_i=x_i|Y=y) 其中是归一化因子。这需要从数据中估计参数。如果我们使用平滑进行此操作,则可以得到估计值αα\alphaP(Xi=xi|Y=y)P(Xi=xi|Y=y)P(X_i=x_i|Y=y)kkk P^(Xi=xi|Y=y)=#{Xi=xi,Y=y}+k#{Y=y}+nikP^(Xi=xi|Y=y)=#{Xi=xi,Y=y}+k#{Y=y}+nik\hat{P}(X_i=x_i|Y=y) = \frac{\#\{X_i=x_i,Y=y\} + k}{\#\{Y=y\}+n_ik} 可能有值。我对此很好。但是,以前,我们有ninin_iXiXiX_i P^(Y=y)=#{Y=y}NP^(Y=y)=#{Y=y}N\hat{P}(Y=y) = \frac{\#\{Y=y\}}{N} 数据集中有示例。为什么我们也不能简化先验?或者说,做我们顺利前?如果是这样,我们选择什么平滑参数?也选择似乎有点愚蠢,因为我们正在做不同的计算。有共识吗?还是没有太大关系?NNNkkk

2
如何在神经网络中将日期编码为输入?
我正在使用神经网络预测时间序列。我现在面临的问题是如何编码日期/时间/序列号。每个输入集合中的哪一个作为神经网络的输入? 我应该按此处所述使用C编码中的一种(用于编码类别)吗? 还是我应该只提供时间(自1970年1月1日以来的毫秒数)? 还是只要按时间顺序提供其余数据,就没有必要提供时间吗?

4
机器学习与系统识别?
谁能给我解释一下机器学习和系统识别之间的区别和相似之处吗?这些只是同一事物的两个名称吗?在此页面中,他们说: 机器学习和系统识别社区面临着类似的问题,需要从有限或嘈杂的观察中构建模型。 我还阅读了Christopher M. Bishop着名的《模式识别与机器学习》一书的前几章。到目前为止,我的结论是,系统识别要解决的问题只是机器学习要解决的问题的一部分。

1
Google DeepDream精心制作
我在该网站上看到了一些有关Deep Dream的问题,但是似乎没有一个人真正谈论DeepDream的工作。据我所知,它们似乎已经改变了目标函数,并且还改变了反向传播方式,因此它们不更新权重而是更新输入图像。 我想知道是否有人确切知道Google做了什么。他们在他们的一篇文章中提到在进行优化时强加贝叶斯先验,由此我可以想象得到让神经网络为每个标签吐出图像并不那么困难-我们可以简单地设置标签,然后相应地优化输入向量。 但是,深梦的有趣之处在于它是逐层执行的,因此,我不太确定它如何逐层强调细节。 当然,提供图像会给您每个神经元的价值,但是我们如何利用这些信息来夸大原始图像中的细节呢?我一直在努力寻找有关此问题的详细文章。 参考:此处vzn回答了类似的问题:https ://cs.stackexchange.com/a/44857/49671 通过该链接,可以在此处实现Deepdream的实现:http ://auduno.com/post/125362849838/visualizing-googlenet-classes 除非它不提供此处讨论的夸张功能,否则:http://googleresearch.blogspot.com/2015/06/inceptionism-going-deeper-into-neural.html 它们都显示特定类和特定层的可视化,并说: 除了确切规定我们要网络放大的功能以外,我们还可以让网络做出决定。在这种情况下,我们只需向网络提供任意图像或照片,然后让网络分析图片。然后,我们选择一个图层并要求网络增强检测到的内容。


By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.