Questions tagged «math»

5
可以训练神经网络来求解数学方程吗?
我知道神经网络可能不是设计成这样做的,但是假设地问,是否有可能训练深度神经网络(或类似的神经网络)来解决数学方程式? 因此,给定3个输入:第一个数字,用数字(1- +,2- -,3- /,4- *等)表示的操作员符号以及第二个数字,然后在训练网络后,应该给我有效的结果。 范例1(2+2): 输入1:2; 输入2: 1(+); 输入3 2; 预期产量:4 输入1:10; 输入2: 2(-); 输入3 10; 预期产量:0 输入1:5; 输入2: 4(*); 输入3 5; 预期产量:25 所以 以上内容可以扩展到更复杂的示例。 那可能吗?如果是这样,什么样的网络可以学习/实现?

4
可以训练深层网络证明定理吗?
假设我们在一阶谓词演算中有大量证明。假设我们在该领域的数学形式中也有公理,推论和定理。 以每个被证明的命题和围绕该特定命题的现有理论为例,作为训练集中的一个例子,并将该命题的已知良好证明作为相关标签。现在,考虑专门为训练该示例集而设计的深层人工网络,并且正确设置超参数也可以这样做。 是否有可能以一种新的命题的表达和围绕它的现有理论以一阶谓词演算形式出现在输入端的方式训练深层的人工网络,从而在输出端产生证明? (当然,这些证明应随后手动检查。) 如果产生的良好证明的比例足够高,是否有可能创建一种遗传算法,向经过训练的深度网络提出建议,从而创建证明? 那可能吗? 是否可以使用这种深度网络设计来解决Collat​​z猜想或Riemann猜想,或者至少以数学家更能够得出合法证明的方式重新排列模式?

6
如何开始学习人工智能?
我是一名软件工程专业的学生,​​并且是AI的完整入门者。我已经阅读了很多有关如何开始学习AI的文章,但是每篇文章都提出了不同的方法。我想知道你们中的某些专家是否可以帮助我以正确的方式开始。 其他一些具体问题 我应该专注于哪种语言?许多文章建议将Python,C ++或Lisp用于AI。我可以使用Java代替上述任何其他语言吗? 我应该具有什么样的数学背景?在第一年,我做了离散数学,其中包括以下主题:集,矩阵,向量,函数,逻辑和图论(他们简短地讲授了这些主题)。现在还有其他我应该学习的主题吗?例如微积分? 如果可能的话,我将不胜感激,可以使用任何资源或书籍来入门,或者也许你们可以给我提供详细的程序,以便跟上您的水平。 注意:目前,我想专注于神经网络和机器学习。之后,我想探索机器人技术和自然语言处理。


2
如何选择激活功能?
我根据需要的输出和已知的激活函数的属性为输出层选择激活函数。例如,当我处理概率时,我选择了S型函数;当我处理正值时,我选择了一个ReLU;当我处理一般值时,我选择了一个线性函数。 在隐藏层中,我使用泄漏的ReLU来避免死亡的神经元,而不是ReLU和tanh而不是乙状结肠。当然,我不会在隐藏单位中使用线性函数。 但是,在隐藏层中对它们的选择主要是由于反复试验。 在某些情况下,哪种激活功能可能会起作用,是否有任何经验法则?尽可能将情况称为“ 情境”:它可能是指该层的深度,NN的深度,该层的神经元数量,我们选择的优化程序,其输入特征的数量。到该NN的应用等 在他/她的答案中,cantordust指的是我未提及的其他激活功能,例如ELU和SELU。此信息非常受欢迎。但是,我发现激活功能越多,对于在隐藏层中使用的功能的选择我就越感到困惑。而且我不认为掷硬币是选择激活功能的好方法。

2
是否有任何科学/数学论据阻止深度学习产生强大的AI?
我读了Judea Pearl的《为什么书》,其中提到深度学习只是一种荣耀的曲线拟合技术,将无法产生类似于人的智力。 在他的书中有这张图说明了认知能力的三个层次: 想法是,当前的深度学习技术所产生的“智能”仅处于关联级别。因此,AI距离问“如何使Y发生”(干预)和“如果我采取不同的行为怎么办,X还会发生吗?”之类的问题相去甚远。(反事实),曲线拟合技术极不可能使我们更接近更高的认知能力。 我发现他的论点在直觉上具有说服力,但我找不到任何可以支持或怀疑该论点的物理或数学定律。 那么,是否有任何科学/物理/化学/生物/数学论证阻止深度学习产生强大的AI(类人智力)?


2
在神经网络中,均方误差是否总是凸出的?
我提到的多种资源都提到MSE很棒,因为它是凸的。但是我不知道怎么做,尤其是在神经网络的情况下。 假设我们有以下内容: XXX:训练数据集 YYY:目标 ΘΘ\Theta:模型(具有非线性的神经网络模型)的参数集fΘfΘf_\Theta 然后: MSE(Θ)=(fΘ(X)−Y)2MSE⁡(Θ)=(fΘ(X)−Y)2\operatorname{MSE}(\Theta) = (f_\Theta(X) - Y)^2 为什么这个损失函数总是凸的?这是否取决于?FΘ(X)fΘ(X)f_\Theta(X)
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.