3 噪声如何影响泛化? 增加数据中的噪声是否有助于提高网络的学习能力?它会有所不同还是取决于要解决的问题?它对总体推广过程有何影响? 11 neural-networks machine-learning statistical-ai generalization
3 如何使我的网络平等对待输入的旋转? 我正在尝试对自己的系统进行编程以运行神经网络。为了减少所需的节点数,建议使它平等地对待输入的旋转。 我的网络旨在通过查看网格中的每个正方形及其周围的正方形,并给出该正方形的输出,来学习和预测Conway的生活游戏。它的输入是9位字符串: 以上表示为010 001 111。 但是,此形状还有另外三个旋转,并且所有旋转均产生相同的输出: 我的网络拓扑是9个输入节点和1个输出节点,用于输入中的中心正方形的下一个状态。如何构造隐藏层,使它们将这些旋转的每一个都相同,从而将可能的输入数量减少到原来的四分之一? 编辑: 每旋转一圈也会产生相同的结果。合并这些将使我的输入减少1/8。使用滑翔机,我的目标是对所有这些输入进行完全相同的处理。这必须通过预处理完成,还是可以将其合并到网络中? 11 neural-networks
4 神经网络可以解决距离的概念吗? 想象一个游戏,它是一个黑屏,一个红色像素和一个蓝色像素。将这个游戏交给人类,他们将首先看到按下箭头键将移动红色像素。他们将尝试的下一件事是将红色像素移动到蓝色像素。 将此游戏交给AI,它将随机移动红色像素,直到一百万次尝试之后,它意外移动到蓝色像素上以获得奖励。如果AI具有红色和蓝色像素之间的距离的某种概念,则它可能会尝试最小化该距离。 如果不对距离的概念进行实际编程,那么如果我们拿游戏中的像素作为像素,我们是否可以计算出一个数字(例如“熵”),那么当像素相距较远而与彼此靠近时,该数字会更低吗?它应与其他像素配置一起使用。例如具有三个像素的游戏,其中一个像素好,一个像素坏。只是为了让神经网络更了解屏幕的外观?然后给NN一个目标,例如“尝试最小化董事会的熵并尝试获得奖励”。 在当前的研究中有什么与此类似的东西吗? 10 neural-networks game-ai path-planning teaching-concepts
1 为什么AlphaGo Zero的合并神经网络比两个独立的神经网络效率更高? 与以前的版本相比,AlphaGo Zero包含了多项改进。在这份备忘单中可以看到Alpha Go Zero的建筑细节。 这些改进之一是使用单个神经网络,该神经网络可以同时计算移动概率和状态值,而旧版本则使用两个单独的神经网络。根据论文表明,合并的神经网络效率更高: 它使用一个神经网络,而不是两个。早期版本的AlphaGo使用“策略网络”来选择下一个动作,并使用“价值网络”来从每个位置预测游戏的获胜者。这些都结合在AlphaGo Zero中,可以对其进行更有效的培训和评估。 对我来说,这似乎很不直观,因为从软件设计的角度来看,这违反了关注点原则上的分离。这就是为什么我想知道为什么合并被证明是有益的。 这种技术-将不同的任务合并到单个神经网络中以提高效率-是否可以总体上应用于其他神经网络,还是需要某些条件才能起作用? 10 neural-networks comparison architecture alphago-zero efficiency
3 使用神经网络识别矩阵中的模式 我正在尝试开发一种神经网络,该网络可以识别CAD模型中的设计特征(即槽,凸台,孔,凹穴,台阶)。 我打算用于网络的输入数据是anxn矩阵(其中n是CAD模型中的面数)。矩阵右上角三角形中的“ 1”表示两个面之间的凸关系,而左下角三角形中的“ 1”表示凹关系。两个位置均为零表示面不相邻。下图给出了这样一个矩阵的例子。 可以说,我将最大模型尺寸设置为20个面,并对小于此尺寸的任何物体应用填充,以使网络输入的尺寸恒定。 我希望能够识别5种不同的设计特征,因此将具有5种输出神经元-[槽,袋,孔,凸台,台阶] 我会说这成为一种“模式识别”问题,对吗?例如,如果我为网络提供了许多训练模型-以及描述模型中存在的设计特征的标签,网络会学会识别与某些设计特征相关的矩阵中表示的特定邻接模式吗? 我是机器学习的一个完整的初学者,我试图了解这种方法是否有效-如果需要更多信息来理解问题,请发表评论。任何输入或帮助,将不胜感激,谢谢。 10 neural-networks machine-learning convolutional-neural-networks pattern-recognition detecting-patterns
1 可以生成程序的AI 我一直在研究Viv开发中的人工智能代理。根据我的理解,该AI可以生成新代码并根据用户查询执行它。我很想知道的是,这种AI如何学习基于某些查询生成代码。此过程涉及哪种机器学习算法?我考虑的一件事是逐步分解程序的数据集。例如: 代码平均取5个学期 1-将所有5个项加在一起 2-除以5 然后,我将训练一种将文本转换为代码的算法。据我所知。但是还没有尝试任何东西,因为我不确定从哪里开始。有人对如何实现Viv有任何想法吗?这是Viv的演示。 10 neural-networks machine-learning deep-learning ai-design natural-language-processing
3 神经网络及其变体是达到真正人工智能的唯一方法吗? 据我所知,当前的大多数人工智能研究都使用某种神经网络或其变体。一个很好的例子是DeepMind的alphago,我认为它是一个深度神经网络,用于视觉CNN,文本,音乐和其他有序特征RNN等。但是对于机器学习应用,我们有神经网络,支持向量机,随机森林,回归方法等可用于应用程序。 那么,神经网络及其变体是达到“真正的”人工智能的唯一途径吗? 10 neural-networks
1 混合激活功能会怎样? 有几种激活功能,例如ReLU,Sigmoid或谭谭\tanh。混合激活功能会怎样? 我最近发现Google开发了Swish激活功能,即(x * sigmoid)。通过更改激活函数,可以提高诸如XOR问题之类的小型神经网络问题的准确性吗? 10 neural-networks machine-learning activation-function relu sigmoid
2 激活神经网络中的神经元意味着什么? 我只是偶然发现了神经元覆盖率的概念,即神经网络中激活的神经元与总神经元之比。但是,神经元被“激活”是什么意思?我知道什么是激活函数,但是被激活意味着什么,例如在ReLU或S型函数的情况下? 10 neural-networks ai-basics concepts activation-function
1 ReLU与Leaky ReLU和Parametric ReLU(如果有)相比有什么优势? 我认为使用Leaky ReLU而不是ReLU的优势在于,这样我们就不会消失梯度。参数化ReLU具有相同的优势,唯一的区别在于,负输入的输出斜率是可学习的参数,而在Leaky ReLU中则是超参数。 但是,我无法确定是否存在使用ReLU代替Leaky ReLU或Parametric ReLU更方便的情况。 10 neural-networks activation-function relu
4 在不久的将来有哪些模型可以取代神经网络? 是否有可能在不久的将来取代神经网络的模型? 而且我们甚至需要吗?就效率而言,使用神经网络最糟糕的事情是什么? 10 neural-networks convolutional-neural-networks recurrent-neural-networks
2 使用AI或神经网络进行徽标检测 我正在尝试检测视频文件中的电视频道徽标,因此只需给定输入.mp4视频,即可检测它是否在特定帧(例如第一帧)中存在该徽标。 我们预先有该徽标(尽管可能不是%100的相同尺寸),并且位置始终是固定的。 我已经有一个基于模式匹配的方法。但这要求图案必须为%100相同大小。我想使用深度学习和神经网络来实现这一目标。我怎样才能做到这一点?相信CNN可以有更高的效率? 10 neural-networks convolutional-neural-networks pattern-recognition detecting-patterns
3 为什么神经网络中的初始权重是随机的? 对于拥有丰富的神经网络经验的人来说,这听起来很愚蠢,但却困扰着我。 我的意思是,将初始权重随机化可能会为您提供更好的结果,该结果会更接近受训网络的外观,但也可能恰好相反,而合理权重范围的平均值为0.5或其他平均值值听起来像是一个很好的默认设置... 为什么对神经元的初始权重进行随机分配而不是对所有神经元进行权重分配? 10 neural-networks training
4 教一个神经网络玩纸牌游戏 我目前正在编写一个玩纸牌游戏的引擎,因为此特定游戏还没有引擎。 我希望以后能够将神经网络引入游戏中,并让它学会玩游戏。 我正在以对AI播放器有用的方式编写引擎。有选择点,并在这些点上显示有效选项的列表。随机选择将能够玩游戏(尽管效果不佳)。 我已经学习了很多有关神经网络(主要是NEAT和HyperNEAT)的知识,甚至建立了自己的实现。我仍然不确定如何最好地构建可以考虑这些类型游戏之一中所有变量的AI。有没有通用的方法?我知道Keldon为RftG编写了很好的AI,它具有相当高的复杂性,我不确定他如何设法建立这样的AI。 有什么建议吗?可行吗 有什么好的例子吗?输入如何映射? 编辑:我在网上看了一下,了解了神经网络如何工作,通常它们与图像识别或操纵简单代理有关。我不确定是否或如何将其应用于具有复杂协同作用的卡片进行选择。朝我应该研究的方向发展将不胜感激。 关于游戏:游戏类似于《魔术:聚会》。有一个具有健康和能力的指挥官。玩家拥有一个能量池,可用来将小兵和咒语放在棋盘上。仆从具有生命值,攻击值,费用等。纸牌也具有能力,这些能力不易枚举。纸牌是从手中开始的,新的纸牌是从牌组中抽出的。这些都是神经网络考虑的方面。 10 neural-networks machine-learning gaming neat
2 如何训练聊天机器人 我想开始尝试神经网络,作为一个玩具问题,我希望训练一个人聊天,即实现像cleverbot这样的聊天机器人。反正不是那么聪明。 我到处找了一些文档,发现有很多关于常规任务的教程,但是关于这个特定主题的教程很少。我发现的只是暴露了结果,而没有给出实现的见解。这样做的人做起来很浅(seq2seq上的tensorflow文档页面缺少imho)。 现在,我觉得我可能已经或多或少地了解了原理,但是我不确定,甚至不确定如何开始。因此,我将解释如何解决该问题,并希望对此解决方案提供反馈,告诉我我在哪里出错了,并且可能与该过程的详细解释和实践知识有任何联系。 我将用于该任务的数据集是我所有Facebook和whatsapp聊天记录的转储。我不知道它会多大,但可能还不够大。目标语言不是英语,因此我不知道在哪里可以快速收集有意义的对话样本。 我将从每个句子中产生一个思想载体。仍然不知道实际如何;我在deeplearning4j网站上找到了word2vec的一个很好的例子,但句子却没有。我了解单词向量的构建方式以及原因,但是我找不到句子向量的详尽解释。 使用思想向量作为输入和输出,我将训练神经网络。我不知道它应该有多少层,哪些必须是lstm层。 然后应该有另一个神经网络,它能够将思想向量转化为组成句子的字符序列。我读到我应该使用填充来弥补不同的句子长度,但是我想念如何编码字符(代码点足够吗?)。 10 neural-networks chat-bots recurrent-neural-networks lstm