程序设计 machine-learning

6

在iOS电子邮件客户端中，当电子邮件中包含日期，时间或位置时，文本将成为超链接，并且只需点击链接即可创建约会或查看地图。它不仅适用于英语的电子邮件，还适用于其他语言的电子邮件。我喜欢这个功能，并且想了解他们是如何做到的。天真的方法是拥有许多正则表达式并全部运行它们。但是我无法很好地扩展，只能用于特定的语言或日期格式等。我认为Apple必须使用某种机器学习的概念来提取实体（8:00 PM、8PM、8:00， 0800、20：00、20h，20h00、2000等）。知道Apple如何能够在其电子邮件客户端中如此快速地提取实体吗？您将应用哪种机器学习算法来完成此类任务？

128 machine-learning nlp information-extraction named-entity-recognition

3

为什么一种热编码可以提高机器学习性能？

我注意到，将One Hot编码用于特定数据集（矩阵）并用作学习算法的训练数据时，与使用原始矩阵本身作为训练数据相比，它在预测准确性方面具有明显更好的结果。如何提高性能？

127 machine-learning data-mining scikit-learn data-analysis

4

对卷积神经网络中1D，2D和3D卷积的直观理解

谁能通过示例清楚地解释卷积神经网络（在深度学习中）的1D，2D和3D卷积之间的区别？

126 machine-learning deep-learning signal-processing conv-neural-network convolution

6

TensorFlow中的步骤和纪元有什么区别？

在大多数模型中，都有一个steps参数，指示要运行数据的步骤数。但是，我发现在最实际的用法中，我们还执行了拟合函数N epochs。以1个时间段运行1000个步和以10个时间段运行100个步有什么区别？在实践中哪一个更好？连续纪元之间有逻辑变化吗？数据改组？

125 machine-learning tensorflow

3

Python-sklearn.pipeline.Pipeline到底是什么？

我不知道如何sklearn.pipeline.Pipeline工作。在文档中有一些解释。例如，它们的意思是：带有最终估算器的变换管线。为了使我的问题更清楚，什么是steps？它们如何运作？编辑多亏了答案，我可以使我的问题更清楚：当我调用管道并通过时，需要两个转换器和一个估计器，例如： pipln = Pipeline([("trsfm1",transformer_1), ("trsfm2",transformer_2), ("estmtr",estimator)]) 我叫这个怎么办？ pipln.fit() OR pipln.fit_transform() 我不知道估算器如何成为变压器以及如何装配变压器。

118 python machine-learning scikit-learn neuraxle

6

C＃中的机器学习库

按照目前的情况，这个问题不适合我们的问答形式。我们希望答案得到事实，参考或专业知识的支持，但是这个问题可能会引起辩论，争论，民意调查或扩展讨论。如果您认为此问题可以解决并且可以重新提出，请访问帮助中心以获取指导。 8年前关闭。 C＃中是否有任何机器学习库？我喜欢WEKA之类的东西。谢谢。

116 c# machine-learning

12

如何在远程服务器上运行Tensorboard？

我是Tensorflow的新手，可以从我所做的一些可视化中受益匪浅。我了解Tensorboard是有用的可视化工具，但是如何在远程Ubuntu计算机上运行它？

116 tensorflow machine-learning data-visualization remote-access tensorboard

9

Google合作实验室：有关其GPU的误导性信息（某些用户只能使用5％的RAM）

更新：此问题与Google Colab的“笔记本设置：硬件加速器：GPU”有关。在添加“ TPU”选项之前就写了这个问题。阅读关于Google Colaboratory提供免费Tesla K80 GPU的多个激动人心的公告，我试图在它上运行fast.ai课程，以使其永远无法完成-很快耗尽内存。我开始调查原因。最重要的是，“免费的Tesla K80”并不是所有人都“免费”的-因为其中只有一小部分是“免费的”。我从加拿大西海岸连接到Google Colab，我只能得到0.5GB的24GB GPU RAM。其他用户可以访问11GB的GPU RAM。显然，对于大多数ML / DL工作而言，0.5GB GPU RAM是不够的。如果您不确定自己能得到什么，这里是我拼凑的一点调试功能（仅适用于笔记本的GPU设置）： # memory footprint support libraries/code !ln -sf /opt/bin/nvidia-smi /usr/bin/nvidia-smi !pip install gputil !pip install psutil !pip install humanize import psutil import humanize import os import GPUtil as GPU GPUs = …

110 python machine-learning gpu ram google-colaboratory

8

期望最大化技术的直观解释是什么？[关闭]

已关闭。这个问题需要更加集中。它当前不接受答案。想改善这个问题吗？更新问题，使其仅通过编辑此帖子来关注一个问题。 2年前关闭。改善这个问题期望最大化（EM）是一种对数据进行分类的概率方法。如果不是分类器，如果我错了，请纠正我。这种EM技术的直观解释是什么？expectation这里是什么，现在是maximized什么？

109 machine-learning cluster-analysis data-mining mathematical-optimization expectation-maximization

4

如何使用scikit learning计算多类案例的精度，召回率，准确性和f1-得分？

我正在研究情绪分析问题，数据看起来像这样： label instances 5 1190 4 838 3 239 1 204 2 127 所以，我的数据是不平衡的，因为1190 instances标有5。对于使用scikit的SVC进行的分类Im 。问题是我不知道如何以正确的方式平衡我的数据，以便准确计算多类案例的精度，查全率，准确性和f1得分。因此，我尝试了以下方法：第一： wclf = SVC(kernel='linear', C= 1, class_weight={1: 10}) wclf.fit(X, y) weighted_prediction = wclf.predict(X_test) print 'Accuracy:', accuracy_score(y_test, weighted_prediction) print 'F1 score:', f1_score(y_test, weighted_prediction,average='weighted') print 'Recall:', recall_score(y_test, weighted_prediction, average='weighted') print 'Precision:', precision_score(y_test, weighted_prediction, average='weighted') print '\n …

109 python machine-learning nlp artificial-intelligence scikit-learn

2

Keras中的多对一和多对多LSTM示例

我尝试了解LSTM以及如何使用Keras构建它们。我发现，主要有4种模式可以运行RNN（图中的4种正确模式）图片来源：Andrej Karpathy 现在，我想知道在Keras中，每个代码的简约代码段看起来如何。所以像 model = Sequential() model.add(LSTM(128, input_shape=(timesteps, data_dim))) model.add(Dense(1)) 对于这4个任务中的每一个，也许需要一点解释。

108 machine-learning neural-network deep-learning keras recurrent-neural-network

5

“ Flatten”在Keras中的作用是什么？

我试图了解该Flatten功能在Keras中的作用。下面是我的代码，它是一个简单的两层网络。它接收形状为（3，2）的二维数据，并输出形状为（1，4）的一维数据： model = Sequential() model.add(Dense(16, input_shape=(3, 2))) model.add(Activation('relu')) model.add(Flatten()) model.add(Dense(4)) model.compile(loss='mean_squared_error', optimizer='SGD') x = np.array([[[1, 2], [3, 4], [5, 6]]]) y = model.predict(x) print y.shape 打印出y形状为（1、4）的图形。但是，如果我删除该Flatten行，则会打印出y形状为（1、3、4）的行。我不明白根据我对神经网络的理解，该model.add(Dense(16, input_shape=(3, 2)))函数正在创建一个具有16个节点的隐藏的全连接层。这些节点中的每个都连接到3x2输入元素中的每个。因此，该第一层输出处的16个节点已经“平坦”。因此，第一层的输出形状应为（1、16）。然后，第二层将此作为输入，并输出形状为（1、4）的数据。因此，如果第一层的输出已经“平坦”并且形状为（1，16），为什么还要进一步使其平坦？

108 machine-learning tensorflow neural-network deep-learning keras

9

为什么将神经网络的权重初始化为随机数？

我正在尝试从头开始构建神经网络。在所有AI文献中都达成共识，即权重应初始化为随机数，以使网络收敛更快。但是为什么神经网络的初始权重被初始化为随机数呢？我在某处读过，这样做是为了“打破对称性”，这使神经网络学习得更快。如何打破对称性使其学习更快？将权重初始化为0会不是一个更好的主意？这样，权重就能更快地找到其值（正负）。除了希望权重在初始化时会接近最佳值之外，还有其他一些潜在的基本原理吗？

105 machine-learning neural-network artificial-intelligence mathematical-optimization gradient-descent

4

多层感知器（MLP）体系结构：选择隐藏层数和隐藏层大小的标准？

如果我们有10个特征向量，则在输入层中可以有10个神经节点;如果我们有5个输出类，则在输出层中可以有5个节点。但是在MLP中选择隐藏层数的标准是多少？ 1个隐藏层中的节点？

104 machine-learning neural-network deep-learning perceptron

8

谁能向我解释StandardScaler？

我无法理解网页的StandardScaler的文档中sklearn。谁能简单地向我解释一下？

103 python machine-learning scikit-learn scaling standardized

Questions tagged «machine-learning»