数据科学

数据科学专业人员,机器学习专家以及有兴趣了解该领域的人员的问答

4
梯度下降是否总是收敛到最佳状态?
我想知道是否存在梯度下降不会收敛到最小的情况。 我知道,梯度下降并不能始终保证收敛到全局最优值。我也知道,如果步长太大,它可能会偏离最佳值。但是,在我看来,如果它偏离某个最佳值,那么它将最终达到另一个最佳值。 因此,将保证梯度下降收敛到局部或全局最优。那正确吗?如果没有,您能否提供一个粗略的反例?

1
使用LSTM进行时间序列预测:使时间序列平稳的重要性
在关于平稳性和差分的链接中,已经提到诸如ARIMA之类的模型需要平稳的时间序列进行预测,因为其统计特性(例如均值,方差,自相关等)随时间是恒定的。由于RNN具有更好的学习非线性关系的能力(如此处给出:用于时间序列预测的递归神经网络),并且在数据量较大时,其性能要优于传统的时间序列模型,因此了解平稳性至关重要数据会影响其结果。我需要知道答案的问题如下: 对于传统的时间序列预测模型,时间序列数据的平稳性使其更易于预测,原因和方式如何? 在使用LSTM建立时间序列预测模型的同时,使时间序列数据平稳是否重要?如果是这样,那为什么呢?

2
pytorch中torch.no_grad有什么用?
我是pytorch的新手,并从此 github代码开始。我不理解代码中60-61行中的注释"because weights have requires_grad=True, but we don't need to track this in autograd"。我了解我们提到requires_grad=True了使用autograd计算梯度所需的变量,但这意味着什么"tracked by autograd"呢?
21 pytorch 

4
如何获得keras模型的准确性,F1,准确性和召回率?
我想为我的二进制KerasClassifier模型计算精度,召回率和F1分数,但找不到任何解决方案。 这是我的实际代码: # Split dataset in train and test data X_train, X_test, Y_train, Y_test = train_test_split(normalized_X, Y, test_size=0.3, random_state=seed) # Build the model model = Sequential() model.add(Dense(23, input_dim=45, kernel_initializer='normal', activation='relu')) model.add(Dense(1, kernel_initializer='normal', activation='sigmoid')) # Compile model model.compile(loss='binary_crossentropy', optimizer='adam', metrics=['accuracy']) tensorboard = TensorBoard(log_dir="logs/{}".format(time.time())) time_callback = TimeHistory() # Fit the model history …

4
自举和交叉验证有什么区别?
我曾经使用K折交叉验证来对我的机器学习模型进行强大的评估。但是我也知道存在用于此目的的引导方法。但是,在性能评估方面,我看不到它们之间的主要区别。 据我所知,引导程序还会产生一定数量的随机训练+测试子集(尽管以不同的方式),那么使用这种方法相对于CV有什么意义呢?我唯一能弄清楚的是,在自举的情况下,可以人为地产生几乎任意数量的此类子集,而对于CV,实例数是对此的一种限制。但是,这方面似乎有点麻烦。

14
数据科学会议?
这是类似的问题,例如CrossValidated的Statistics Conferences问题。 什么是最重要的年度数据科学会议? 规则: 包括会议链接 请提供演讲链接(无论是youtube,会议网站还是其他视频流媒体网站)
20 community 




3
开始我作为数据科学家的职业,是否需要软件工程经验?[关闭]
关闭。这个问题是题外话。它当前不接受答案。 想改善这个问题吗? 更新问题,使它成为Data Science Stack Exchange 的主题。 5年前关闭。 我是爱丁堡大学的理学硕士,专门研究机器学习和自然语言处理。我有一些实践课程侧重于数据挖掘,还有一些涉及机器学习,贝叶斯统计和图形模型的课程。我的背景是计算机科学学士学位。 我进行了一些软件工程,并且学习了基本概念,例如设计模式,但是我从未参与过大型软件开发项目。但是,我在MSc中有一个数据挖掘项目。我的问题是,如果我想以数据科学家的身份求职,应该先申请研究生数据科学家的职位,还是先获得研究生软件工程师的职位,也许是与数据科学相关的事情,例如大数据基础设施或机器学习软件开发? 我担心的是,我可能需要良好的数据科学软件工程技能,而且我不确定是否可以通过直接担任研究生数据科学家来获得这些技能。 此外,目前我喜欢Data Mining,但是如果将来我想将自己的职业转到软件工程该怎么办?如果我专门研究数据科学,可能会很难。 我尚未受雇,所以我的知识仍然有限。欢迎您提出任何澄清或建议,因为我即将完成理学硕士课程,我想在10月初开始申请研究生职位。

2
使用Word2vec模型预测单词
给出一个句子:“当我打开??门时,它会自动开始加热” 我想获得??中可能的单词的列表 很有可能。 word2vec模型中使用的基本概念是根据周围环境“预测”单词。 一旦建立模型,什么是正确的上下文向量运算以对新句子执行我的预测任务? 它仅仅是线性和吗? model.most_similar(positive=['When','I','open','the','door','it','starts' ,'heating','automatically'])

4
如何衡量单词的语义相似性?
找出单词语义相似性的最佳方法是什么?Word2Vec可以,但不理想: # Using the 840B word Common Crawl GloVe vectors with gensim: # 'hot' is closer to 'cold' than 'warm' In [7]: model.similarity('hot', 'cold') Out[7]: 0.59720456121072973 In [8]: model.similarity('hot', 'warm') Out[8]: 0.56784095376659627 # Cold is much closer to 'hot' than 'popular' In [9]: model.similarity('hot', 'popular') Out[9]: 0.33708479049537632 NLTK的Wordnet方法似乎只是放弃: In [25]: …

3
使用深度学习库从文本中提取关键字/短语
也许这太广泛了,但是我正在寻找有关如何在文本摘要任务中使用深度学习的参考。 我已经使用标准的词频方法和句子排序来实现文本摘要,但是我想探索使用深度学习技术来完成此任务的可能性。我还通过使用卷积神经网络(CNN)进行情感分析,在wildml.com上进行了一些实现;我想知道如何使用TensorFlow或Theano等库进行文本汇总和关键字提取。自从我开始尝试神经网络以来已经过去了大约一周的时间,我非常高兴地看到这些库的性能与我以前解决此问题的方法相比如何。 我特别在寻找一些有趣的论文和与使用这些框架进行文本汇总有关的github项目。谁能提供一些参考资料给我?


2
Keras vs.tf.keras
我在为新研究项目选择Keras(keras-team / keras)和tf.keras(tensorflow / tensorflow / python / keras /)之间有点困惑。 有争论称,Keras不归任何人所有,因此人们更乐于参与其中,将来管理该项目将更加容易。‬ 在另一边,tf.keras是由谷歌所拥有,因此更严格的测试和维护。而且,这似乎是利用Tensorflow v.2中提供的新功能的更好选择。 因此,要启动一个数据科学(机器学习)项目(在研究阶段),在开始时都没问题,您选择哪个?

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.