Questions tagged «machine-learning»

有关机器学习算法的实现问题。有关机器学习的一般问题应发布到其特定社区。

6
苹果如何找到电子邮件中的日期,时间和地址?
在iOS电子邮件客户端中,当电子邮件中包含日期,时间或位置时,文本将成为超链接,并且只需点击链接即可创建约会或查看地图。它不仅适用于英语的电子邮件,还适用于其他语言的电子邮件。我喜欢这个功能,并且想了解他们是如何做到的。 天真的方法是拥有许多正则表达式并全部运行它们。但是我无法很好地扩展,只能用于特定的语言或日期格式等。我认为Apple必须使用某种机器学习的概念来提取实体(8:00 PM、8PM、8:00, 0800、20:00、20h,20h00、2000等)。 知道Apple如何能够在其电子邮件客户端中如此快速地提取实体吗?您将应用哪种机器学习算法来完成此类任务?



6
TensorFlow中的步骤和纪元有什么区别?
在大多数模型中,都有一个steps参数,指示要运行数据的步骤数。但是,我发现在最实际的用法中,我们还执行了拟合函数N epochs。 以1个时间段运行1000个步和以10个时间段运行100个步有什么区别?在实践中哪一个更好?连续纪元之间有逻辑变化吗?数据改组?

3
Python-sklearn.pipeline.Pipeline到底是什么?
我不知道如何sklearn.pipeline.Pipeline工作。 在文档中有一些解释。例如,它们的意思是: 带有最终估算器的变换管线。 为了使我的问题更清楚,什么是steps?它们如何运作? 编辑 多亏了答案,我可以使我的问题更清楚: 当我调用管道并通过时,需要两个转换器和一个估计器,例如: pipln = Pipeline([("trsfm1",transformer_1), ("trsfm2",transformer_2), ("estmtr",estimator)]) 我叫这个怎么办? pipln.fit() OR pipln.fit_transform() 我不知道估算器如何成为变压器以及如何装配变压器。

6
C#中的机器学习库
按照目前的情况,这个问题不适合我们的问答形式。我们希望答案得到事实,参考或专业知识的支持,但是这个问题可能会引起辩论,争论,民意调查或扩展讨论。如果您认为此问题可以解决并且可以重新提出,请访问帮助中心以获取指导。 8年前关闭。 C#中是否有任何机器学习库?我喜欢WEKA之类的东西。谢谢。


9
Google合作实验室:有关其GPU的误导性信息(某些用户只能使用5%的RAM)
更新:此问题与Google Colab的“笔记本设置:硬件加速器:GPU”有关。在添加“ TPU”选项之前就写了这个问题。 阅读关于Google Colaboratory提供免费Tesla K80 GPU的多个激动人心的公告,我试图在它上运行fast.ai课程,以使其永远无法完成-很快耗尽内存。我开始调查原因。 最重要的是,“免费的Tesla K80”并不是所有人都“免费”的-因为其中只有一小部分是“免费的”。 我从加拿大西海岸连接到Google Colab,我只能得到0.5GB的24GB GPU RAM。其他用户可以访问11GB的GPU RAM。 显然,对于大多数ML / DL工作而言,0.5GB GPU RAM是不够的。 如果您不确定自己能得到什么,这里是我拼凑的一点调试功能(仅适用于笔记本的GPU设置): # memory footprint support libraries/code !ln -sf /opt/bin/nvidia-smi /usr/bin/nvidia-smi !pip install gputil !pip install psutil !pip install humanize import psutil import humanize import os import GPUtil as GPU GPUs = …

8
期望最大化技术的直观解释是什么?[关闭]
已关闭。这个问题需要更加集中。它当前不接受答案。 想改善这个问题吗?更新问题,使其仅通过编辑此帖子来关注一个问题。 2年前关闭。 改善这个问题 期望最大化(EM)是一种对数据进行分类的概率方法。如果不是分类器,如果我错了,请纠正我。 这种EM技术的直观解释是什么?expectation这里是什么,现在是maximized什么?

4
如何使用scikit learning计算多类案例的精度,召回率,准确性和f1-得分?
我正在研究情绪分析问题,数据看起来像这样: label instances 5 1190 4 838 3 239 1 204 2 127 所以,我的数据是不平衡的,因为1190 instances标有5。对于使用scikit的SVC进行的分类Im 。问题是我不知道如何以正确的方式平衡我的数据,以便准确计算多类案例的精度,查全率,准确性和f1得分。因此,我尝试了以下方法: 第一: wclf = SVC(kernel='linear', C= 1, class_weight={1: 10}) wclf.fit(X, y) weighted_prediction = wclf.predict(X_test) print 'Accuracy:', accuracy_score(y_test, weighted_prediction) print 'F1 score:', f1_score(y_test, weighted_prediction,average='weighted') print 'Recall:', recall_score(y_test, weighted_prediction, average='weighted') print 'Precision:', precision_score(y_test, weighted_prediction, average='weighted') print '\n …

2
Keras中的多对一和多对多LSTM示例
我尝试了解LSTM以及如何使用Keras构建它们。我发现,主要有4种模式可以运行RNN(图中的4种正确模式) 图片来源:Andrej Karpathy 现在,我想知道在Keras中,每个代码的简约代码段看起来如何。所以像 model = Sequential() model.add(LSTM(128, input_shape=(timesteps, data_dim))) model.add(Dense(1)) 对于这4个任务中的每一个,也许需要一点解释。

5
“ Flatten”在Keras中的作用是什么?
我试图了解该Flatten功能在Keras中的作用。下面是我的代码,它是一个简单的两层网络。它接收形状为(3,2)的二维数据,并输出形状为(1,4)的一维数据: model = Sequential() model.add(Dense(16, input_shape=(3, 2))) model.add(Activation('relu')) model.add(Flatten()) model.add(Dense(4)) model.compile(loss='mean_squared_error', optimizer='SGD') x = np.array([[[1, 2], [3, 4], [5, 6]]]) y = model.predict(x) print y.shape 打印出y形状为(1、4)的图形。但是,如果我删除该Flatten行,则会打印出y形状为(1、3、4)的行。 我不明白 根据我对神经网络的理解,该model.add(Dense(16, input_shape=(3, 2)))函数正在创建一个具有16个节点的隐藏的全连接层。这些节点中的每个都连接到3x2输入元素中的每个。因此,该第一层输出处的16个节点已经“平坦”。因此,第一层的输出形状应为(1、16)。然后,第二层将此作为输入,并输出形状为(1、4)的数据。 因此,如果第一层的输出已经“平坦”并且形状为(1,16),为什么还要进一步使其平坦?

9
为什么将神经网络的权重初始化为随机数?
我正在尝试从头开始构建神经网络。在所有AI文献中都达成共识,即权重应初始化为随机数,以使网络收敛更快。 但是为什么神经网络的初始权重被初始化为随机数呢? 我在某处读过,这样做是为了“打破对称性”,这使神经网络学习得更快。如何打破对称性使其学习更快? 将权重初始化为0会不是一个更好的主意?这样,权重就能更快地找到其值(正负)。 除了希望权重在初始化时会接近最佳值之外,还有其他一些潜在的基本原理吗?



By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.