数据科学 keras

1

什么是利弊Keras和TFlearn？一个图书馆何时比另一个图书馆更受青睐？

18 machine-learning keras tflearn

1

我是机器学习和keras的新手，现在正在使用keras处理多类图像分类问题。输入的是带标签的图像。经过一些预处理后，训练数据在Python列表中表示为： [["dog", "path/to/dog/imageX.jpg"],["cat", "path/to/cat/imageX.jpg"], ["bird", "path/to/cat/imageX.jpg"]] “狗”，“猫”和“鸟”是类标签。我认为应该使用一站式编码解决此问题，但是我对如何处理这些字符串标签不是很清楚。我已经尝试过sklearn的LabelEncoder（）： encoder = LabelEncoder() trafomed_label = encoder.fit_transform(["dog", "cat", "bird"]) print(trafomed_label) 输出是[2 1 0]，这与我对[[1,0,0]，[0,1,0]，[0,0,1]]之类的东西的期望输出不同。可以通过一些编码来完成，但是我想知道是否有某种“标准”或“传统”方式来处理它？

18 machine-learning scikit-learn tensorflow keras encoding

2

Keras Convolution2d（）使用的默认过滤器是什么？

我是神经网络的新手，但是我相当了解线性代数和卷积数学。我试图理解我在网上各个地方找到的示例代码，用于训练带有MNIST数据的Keras卷积NN以识别数字。我的期望是，当我创建卷积层时，必须指定一个过滤器或一组过滤器以应用于输入。但是我发现的三个样本都创建了一个这样的卷积层： model.add(Convolution2D(nb_filter = 32, nb_row = 3, nb_col = 3, border_mode='valid', input_shape=input_shape)) 这似乎将总共32个3x3滤镜应用于CNN处理的图像。但是那些过滤器是什么？我将如何数学描述它们？keras文档没有帮助。提前致谢，

18 convnet keras

4

使用Keras（Python）进行LSTM-RNN的超参数搜索

来自Keras RNN教程的文章：“ RNN 很棘手。批大小的选择很重要，损耗和优化器的选择很重要，等等。某些配置无法融合。” 因此，这是关于在Keras上调整LSTM-RNN的超参数的一个普遍问题。我想知道一种为您的RNN查找最佳参数的方法。我从Keras'Github上的IMDB示例开始。主要模型如下： (X_train, y_train), (X_test, y_test) = imdb.load_data(nb_words=max_features, test_split=0.2) max_features = 20000 maxlen = 100 # cut texts after this number of words (among top max_features most common words) batch_size = 32 model = Sequential() model.add(Embedding(max_features, 128, input_length=maxlen)) model.add(LSTM(128)) model.add(Dropout(0.5)) model.add(Dense(1)) model.add(Activation('sigmoid')) # try using …

18 python neural-network deep-learning keras hyperparameter

1

训练期间val_loss与损失之间的Keras差异

在Keras中进行培训val_loss与loss进行培训有什么区别？例如 Epoch 1/20 1000/1000 [==============================] - 1s - loss: 0.1760, val_loss: 0.2032 在某些网站上，我读到在验证时，辍学不起作用。

18 machine-learning deep-learning keras

1

Keras的fit函数的validation_split参数如何工作？

在https://keras.io/models/sequential/上记录了Keras顺序模型拟合函数中的验证拆分： validation_split：在0到1之间浮动。要用作验证数据的训练数据的分数。模型将分开训练数据的这一部分，不对其进行训练，并且将在每个时期结束时评估此数据的损失和任何模型度量。在改组之前，从提供的x和y数据中的最后一个样本中选择验证数据。请注意最后一行：在改组之前，从提供的x和y数据中的最后一个样本中选择验证数据。这是否意味着验证数据始终是固定的，并且取自主数据集的底部？有什么办法可以从主数据集中随机选择给定的数据部分？

17 keras data cross-validation

5

扩大seaborn热图

我corr()用原始df 创建了df。该corr()DF出来70×70，这是不可能的可视化热图... sns.heatmap(df)。如果我尝试显示corr = df.corr()，则表格不适合屏幕，并且我可以看到所有相关性。它是打印整个df大小而不管其大小还是控制热图大小的方法吗？

17 visualization pandas plotting machine-learning neural-network svm decision-trees svm efficiency python linear-regression machine-learning nlp topic-model lda named-entity-recognition naive-bayes-classifier association-rules fuzzy-logic kaggle deep-learning tensorflow inception classification feature-selection feature-engineering machine-learning scikit-learn tensorflow keras encoding nlp text-mining nlp rnn python neural-network feature-extraction machine-learning predictive-modeling python r linear-regression clustering r ggplot2 neural-network neural-network training python neural-network deep-learning rnn predictive-modeling databases sql programming distribution dataset cross-validation neural-network deep-learning rnn machine-learning machine-learning python deep-learning data-mining tensorflow visualization tools sql embeddings orange feature-extraction unsupervised-learning gan machine-learning python data-mining pandas machine-learning data-mining bigdata apache-spark apache-hadoop deep-learning python convnet keras aggregation clustering k-means r random-forest decision-trees reference-request visualization data pandas plotting neural-network keras rnn theano deep-learning tensorflow inception predictive-modeling deep-learning regression sentiment-analysis nlp encoding deep-learning python scikit-learn lda convnet keras predictive-modeling regression overfitting regression svm prediction machine-learning similarity word2vec information-retrieval word-embeddings neural-network deep-learning rnn

2

Keras回调示例，用于在每个时期后保存模型？

有人可以在每个时期后使用回调函数发布一个简单的Keras示例来保存模型吗？我可以找到节省权重的示例，但是我希望能够在每次训练之后都保存一个功能完整的模型。

17 python keras

5

TensorFlow还为keras提供什么？

我知道keras充当TensorFlow的高级接口。但是在我看来，keras可以自己完成许多功能（数据输入，模型创建，训练，评估）。此外，TensorFlow的某些功能可以直接移植到keras（例如，可以在keras中使用tf度量或损失函数）。我的问题是，TensorFlow提供了哪些无法在keras中复制的功能？

16 keras tensorflow

3

如何使用predict_generator对Keras中的流测试数据进行预测？

在Keras从头开始培训卷积网络的博客中，代码仅显示了运行在培训和验证数据上的网络。那测试数据呢？验证数据是否与测试数据相同（我认为不是）。如果在与train和validation文件夹相似的行上有一个单独的测试文件夹，我们如何获得测试数据的混淆矩阵。我知道我们必须使用scikit Learn或其他软件包来执行此操作，但是如何从类明智的测试数据概率中获取一些信息呢？我希望将其用于混淆矩阵。

16 machine-learning python deep-learning keras confusion-matrix

2

Keras中的fit（）和fit_generator（）有什么区别？

fit()和fit_generator()Keras 和有什么不一样？什么时候应该使用fit()vs fit_generator()？

16 deep-learning keras

6

Keras —转移学习—更改输入张量形状

这篇文章似乎表明我想完成的事情是不可能的。但是，我不相信这一点-鉴于我已经做过，我不明白为什么我想做的事情无法实现... 我有两个图像数据集，其中一个具有形状（480、720、3）的图像，而另一个具有形状（540、960、3）的图像。我使用以下代码初始化了一个模型： input = Input(shape=(480, 720, 3), name='image_input') initial_model = VGG16(weights='imagenet', include_top=False) for layer in initial_model.layers: layer.trainable = False x = Flatten()(initial_model(input)) x = Dense(1000, activation='relu')(x) x = BatchNormalization()(x) x = Dropout(0.5)(x) x = Dense(1000, activation='relu')(x) x = BatchNormalization()(x) x = Dropout(0.5)(x) x = Dense(14, activation='linear')(x) model = Model(inputs=input, …

15 keras

3

Keras的model.predict函数的输出是什么意思？

我建立了一个LSTM模型来预测Quora官方数据集上的重复问题。测试标签为0或1。1表示问题对重复。使用建立模型后model.fit，我将model.predict在测试数据上使用模型进行测试。输出是一个值数组，如下所示： [ 0.00514298] [ 0.15161049] [ 0.27588326] [ 0.00236167] [ 1.80067325] [ 0.01048524] [ 1.43425131] [ 1.99202418] [ 0.54853892] [ 0.02514757] 我只显示数组中的前10个值。我不明白这些值是什么意思，每个问题对的预计标签是什么？

14 machine-learning python neural-network keras lstm

5

考虑到辍学会抑制模型中的某些神经元，为什么添加辍学层会改善深度/机器学习性能？

如果删除一些神经元会产生更好的性能模型，为什么不首先使用层数更少，神经元更少的简单神经网络呢？为什么要在开始时建立一个更大，更复杂的模型，而在以后取消它的一部分呢？

13 machine-learning deep-learning keras regularization dropout

2

如何在Keras中实现“一对多”和“多对多”序列预测？

我很难解释一对一（例如，单个图像的分类）和多对多（例如，图像序列的分类）序列标签的Keras编码差异。我经常看到两种不同的代码：类型1是没有应用TimeDistributed的地方，如下所示： model=Sequential() model.add(Convolution2D(nb_filters, kernel_size[0], kernel_size[1], border_mode="valid", input_shape=[1, 56,14])) model.add(Activation("relu")) model.add(Convolution2D(nb_filters, kernel_size[0], kernel_size[1])) model.add(Activation("relu")) model.add(MaxPooling2D(pool_size=pool_size)) model.add(Reshape((56*14,))) model.add(Dropout(0.25)) model.add(LSTM(5)) model.add(Dense(50)) model.add(Dense(nb_classes)) model.add(Activation("softmax")) 类型2是应用TimeDistributed的地方，如下所示： model = Sequential() model.add(InputLayer(input_shape=(5, 224, 224, 3))) model.add(TimeDistributed(Convolution2D(64, (3, 3)))) model.add(TimeDistributed(MaxPooling2D((2,2), strides=(2,2)))) model.add(LSTM(10)) model.add(Dense(3)) 我的问题是：我的假设是正确的，类型1是一对多类型，类型2是多对多类型吗？还是TimeDistributed在这方面没有关联？在一对多或多对多的情况下，最后一个密集层应为1个节点“长”（依次仅发出一个值），而先前的循环层负责确定有多少个 1长发射的价值？或者最后一个密集层应该由N个节点组成，其中N=max sequence length？如果是这样，当我们可以使用N个并行“原始”估计量产生具有多个输出的相似输入时，在这里使用RNN 有什么意义？如何定义RNN中的时间步数？它是某种程度上与输出序列长度相关，还是只是需要调整的超参数？上面我的Type …

13 keras rnn lstm sequence

Questions tagged «keras»