Questions tagged «pca»

2
做PCA时要减少多少尺寸?
如何为PCA选择K?K是要向下投影的尺寸数。唯一的要求是不要丢失太多信息。我了解这取决于数据,但我希望更多地了解有关选择K时应考虑哪些特征的简单概述。
12 pca 

3
是否有适用于python的好的即用型语言模型?
我正在为一个应用程序制作原型,我需要一个语言模型来计算一些生成的句子的困惑度。 我可以随时使用经过训练的python语言模型吗?简单的东西 model = LanguageModel('en') p1 = model.perplexity('This is a well constructed sentence') p2 = model.perplexity('Bunny lamp robert junior pancake') assert p1 < p2 我看过一些框架,但找不到我想要的。我知道我可以使用类似: from nltk.model.ngram import NgramModel lm = NgramModel(3, brown.words(categories='news')) 这在Brown Corpus上使用了很好的图林概率分布,但是我正在一些大型数据集(例如1b单词数据集)上寻找精心设计的模型。我可以真正相信一般领域的结果(不仅是新闻)
11 python  nlp  language-model  r  statistics  linear-regression  machine-learning  classification  random-forest  xgboost  python  sampling  data-mining  orange  predictive-modeling  recommender-system  statistics  dimensionality-reduction  pca  machine-learning  python  deep-learning  keras  reinforcement-learning  neural-network  image-classification  r  dplyr  deep-learning  keras  tensorflow  lstm  dropout  machine-learning  sampling  categorical-data  data-imputation  machine-learning  deep-learning  machine-learning-model  dropout  deep-network  pandas  data-cleaning  data-science-model  aggregation  python  neural-network  reinforcement-learning  policy-gradients  r  dataframe  dataset  statistics  prediction  forecasting  r  k-means  python  scikit-learn  labels  python  orange  cloud-computing  machine-learning  neural-network  deep-learning  rnn  recurrent-neural-net  logistic-regression  missing-data  deep-learning  autoencoder  apache-hadoop  time-series  data  preprocessing  classification  predictive-modeling  time-series  machine-learning  python  feature-selection  autoencoder  deep-learning  keras  tensorflow  lstm  word-embeddings  predictive-modeling  prediction  machine-learning-model  machine-learning  classification  binary  theory  machine-learning  neural-network  time-series  lstm  rnn  neural-network  deep-learning  keras  tensorflow  convnet  computer-vision 


4
PCA是否被视为机器学习算法
我知道主成分分析是一种降维技术,即给定10个输入特征,它将产生较少数量的独立特征,这些特征是原始特征的正交和线性变换。 是PCA由本身视为学习算法或它是一个数据预处理步骤。

4
分类多元时间序列
我有一组由约40个维度的时间序列(8个点)组成的数据(因此每个时间序列为8 x 40)。对应的输出(类别的可能结果)为0或1。 设计具有多个维度的时间序列的分类器的最佳方法是什么? 我最初的策略是从这些时间序列中提取特征:均值,标准差,每个维度的最大变化。我获得了用于训练RandomTreeForest的数据集。意识到这一点的天真之处,并且在获得较差的结果之后,我现在正在寻找一种更好的模型。 我的线索如下:对每个维度进行系列分类(使用KNN算法和DWT),使用PCA降低维度,并沿多维类别使用最终分类器。作为ML的新手,我不知道自己是否完全错了。
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.