浅谈keras 模型用于预测时的注意事项

更新时间：2020年6月28日 09:00 点击：1484

为什么训练误差比测试误差高很多？

一个Keras的模型有两个模式：训练模式和测试模式。一些正则机制，如Dropout，L1/L2正则项在测试模式下将不被启用。

另外，训练误差是训练数据每个batch的误差的平均。在训练过程中，每个epoch起始时的batch的误差要大一些，而后面的batch的误差要小一些。另一方面，每个epoch结束时计算的测试误差是由模型在epoch结束时的状态决定的，这时候的网络将产生较小的误差。

【Tips】可以通过定义回调函数将每个epoch的训练误差和测试误差并作图，如果训练误差曲线和测试误差曲线之间有很大的空隙，说明你的模型可能有过拟合的问题。当然，这个问题与Keras无关。

在keras中文文档中指出了这一误区，笔者认为产生这一问题的原因在于网络实现的机制。即dropout层有前向实现和反向实现两种方式，这就决定了概率p是在训练时候设置还是测试的时候进行设置

利用预训练的权值进行Fine tune时的注意事项：

不能把自己添加的层进行将随机初始化后直接连接到前面预训练后的网络层

in order to perform fine-tuning, all layers should start with properly trained weights: for instance you should not slap a randomly initialized fully-connected network on top of a pre-trained convolutional base. This is because the large gradient updates triggered by the randomly initialized weights would wreck the learned weights in the convolutional base. In our case this is why we first train the top-level classifier, and only then start fine-tuning convolutional weights alongside it.

we choose to only fine-tune the last convolutional block rather than the entire network in order to prevent overfitting, since the entire network would have a very large entropic capacity and thus a strong tendency to overfit. The features learned by low-level convolutional blocks are more general, less abstract than those found higher-up, so it is sensible to keep the first few blocks fixed (more general features) and only fine-tune the last one (more specialized features).

fine-tuning should be done with a very slow learning rate, and typically with the SGD optimizer rather than an adaptative learning rate optimizer such as RMSProp. This is to make sure that the magnitude of the updates stays very small, so as not to wreck the previously learned features.

补充知识：keras框架中用keras.models.Model做的时候预测数据不是标签的问题

我们发现，在用Sequential去搭建网络的时候，其中有predict和predict_classes两个预测函数，前一个是返回的精度，后面的是返回的具体标签。但是，在使用keras.models.Model去做的时候，就会发现，它只有一个predict函数，没有返回标签的predict_classes函数，所以，针对这个问题，我们将其改写。改写如下：

def my_predict_classes(predict_data):
  if predict_data.shape[-1] > 1:
    return predict_data.argmax(axis=-1)
  else:
    return (predict_data > 0.5).astype('int32')
 
# 这里省略网络搭建部分。。。。
 
model = Model(data_input, label_output)
model.compile(loss='categorical_crossentropy',
       optimizer=keras.optimizers.Nadam(lr=0.002),
       metrics=['accuracy'])
model.summary()
 
y_predict = model.predict(X_test)
y_pre = my_predict_classes(y_predict)

这样，y_pre就是具体的标签了。

以上这篇浅谈keras 模型用于预测时的注意事项就是小编分享给大家的全部内容了，希望能给大家一个参考，也希望大家多多支持猪先飞。

[!--infotagslink--]

上一篇: Pytorch 高效使用GPU的操作

下一篇: PyTorch之nn.ReLU与F.ReLU的区别介绍

详解为什么现代系统需要一个新的编程模型
如今高要求的分布式系统的建造者遇到了不能完全由传统的面向对象编程(OOP)模型解决的挑战，但这可以从Actor模型中获益。...2021-05-20
在Keras中利用np.random.shuffle()打乱数据集实例
这篇文章主要介绍了在Keras中利用np.random.shuffle()打乱数据集实例，具有很好的参考价值，希望对大家有所帮助。一起跟随小编过来看看吧...2020-06-16
解决在keras中使用model.save()函数保存模型失败的问题
这篇文章主要介绍了解决在keras中使用model.save()函数保存模型失败的问题，具有很好的参考价值，希望对大家有所帮助。一起跟随小编过来看看吧...2020-05-21
Python通过VGG16模型实现图像风格转换操作详解
这篇文章主要介绍了Python通过VGG16模型实现图像风格转换操作,结合实例形式详细分析了Python使用VGG16模型实现图像风格转换的具体原理、操作步骤与实现方法,需要的朋友可以参考下...2020-04-27
解决Keras 中加入lambda层无法正常载入模型问题
这篇文章主要介绍了解决Keras 中加入lambda层无法正常载入模型问题，具有很好的参考价值，希望对大家有所帮助。一起跟随小编过来看看吧...2020-06-17
keras.layer.input()用法说明
这篇文章主要介绍了keras.layer.input()用法说明，具有很好的参考价值，希望对大家有所帮助。一起跟随小编过来看看吧...2020-06-17
PyTorch使用cpu加载模型运算方式
今天小编就为大家分享一篇PyTorch使用cpu加载模型运算方式，具有很好的参考价值，希望对大家有所帮助。一起跟随小编过来看看吧...2020-04-27
keras的三种模型实现与区别说明
这篇文章主要介绍了keras的三种模型实现与区别说明，具有很好的参考价值，希望对大家有所帮助。一起跟随小编过来看看吧...2020-07-04
Tensorflow读取并输出已保存模型的权重数值方式
今天小编就为大家分享一篇Tensorflow读取并输出已保存模型的权重数值方式，具有很好的参考价值，希望对大家有所帮助。一起跟随小编过来看不看...2020-04-30
完美解决TensorFlow和Keras大数据量内存溢出的问题
这篇文章主要介绍了完美解决TensorFlow和Keras大数据量内存溢出的问题，具有很好的参考价值，希望对大家有所帮助。一起跟随小编过来看看吧...2020-07-04
利用keras使用神经网络预测销量操作
这篇文章主要介绍了利用keras使用神经网络预测销量操作，具有很好的参考价值，希望对大家有所帮助。一起跟随小编过来看看吧...2020-07-08
pytorch获取模型某一层参数名及参数值方式
今天小编就为大家分享一篇pytorch获取模型某一层参数名及参数值方式，具有很好的价值，希望对大家有所帮助。一起跟随小编过来看看吧...2020-05-08
使用keras实现孪生网络中的权值共享教程
这篇文章主要介绍了使用keras实现孪生网络中的权值共享教程，具有很好的参考价值，希望对大家有所帮助。一起跟随小编过来看看吧...2020-06-11
PyTorch 多GPU下模型的保存与加载(踩坑笔记)
这篇文章主要介绍了PyTorch 多GPU下模型的保存与加载(踩坑笔记)，文中通过示例代码介绍的非常详细，对大家的学习或者工作具有一定的参考学习价值，需要的朋友们下面随着小编来一起学习学习吧...2021-03-09
keras:model.compile损失函数的用法
这篇文章主要介绍了keras:model.compile损失函数的用法，具有很好的参考价值，希望对大家有所帮助。一起跟随小编过来看看吧...2020-07-02
pytorch模型的保存和加载、checkpoint操作
这篇文章主要介绍了pytorch模型的保存和加载、checkpoint操作，具有很好的参考价值，希望对大家有所帮助。如有错误或未考虑完全的地方，望不吝赐教...2021-06-06
keras输出预测值和真实值方式
这篇文章主要介绍了keras输出预测值和真实值方式，具有很好的参考价值，希望对大家有所帮助。一起跟随小编过来看看吧...2020-06-28
如何使用flask将模型部署为服务
在某些场景下，我们需要将机器学习或者深度学习模型部署为服务给其它地方调用，本文接下来就讲解使用python的flask部署服务的基本过程。...2021-05-14
图文详解laravel多对多关联模型
多对多就相当于一个专题Topic有多个文章,但是这多个文章又属于多个专题,下面这篇文章主要给大家介绍了关于laravel多对多关联模型的相关资料,需要的朋友可以参考下...2021-08-11
keras实现基于孪生网络的图片相似度计算方式
这篇文章主要介绍了keras实现基于孪生网络的图片相似度计算方式，具有很好的参考价值，希望对大家有所帮助。一起跟随小编过来看看吧...2020-06-12

浅谈keras 模型用于预测时的注意事项

相关文章

阁下可能感兴趣的内容

推荐阅读