keras实现多GPU或指定GPU的使用介绍

更新时间：2020年6月18日 07:24 点击：2146

1. keras新版本中加入多GPU并行使用的函数

下面程序段即可实现一个或多个GPU加速：

注意：使用多GPU加速时，Keras版本必须是Keras2.0.9以上版本

from keras.utils.training_utils import multi_gpu_model  #导入keras多GPU函数
import VGG19   #导入已经写好的函数模型，例如VGG19

if G <= 1:
  print("[INFO] training with 1 GPU...")
  model = VGG19（）

# otherwise, we are compiling using multiple GPUs
else:
  print("[INFO] training with {} GPUs...".format(G))
  # we'll store a copy of the model on *every* GPU and then combine
  # the results from the gradient updates on the CPU
  with tf.device("/cpu:0"):
    # initialize the model
    model1 = VGG19（）
    # make the model parallel(if you have more than 2 GPU)
    model = multi_gpu_model(model1, gpus=G)

2.指定使用某个GPU

首先在终端查看主机中GPU编号：

watch -n -9 nvidia-smi

查询结果如下所示：

显示主机中只有一块GPU，编号为0

2.1 下面方法是直接在终端运行时加入相关语句实现指定GPU的使用

export CUDA_VISIBLE_DEVICES=0 python test.py
# 表示运行test.py文件时，使用编号为0的GPU卡
export CUDA_VISIBLE_DEVICES=0,2 python test.py
# 表示运行test.py文件时，使用编号为0和2的GPU卡

2.2 下面方法是在Python程序中添加

import os
# 使用第一张与第三张GPU卡
os.environ["CUDA_VISIBLE_DEVICES"] = "0, 2"

补充知识：踩坑记----large batch_size cause low var_acc

有时候，我们在训练模型前期，会出现很高的train_acc(训练准确率),但var_acc（验证准确率）却很低。这往往是因为我们模型在训练过程中已经进入局部最优，或者出现过拟合的现象。造成这种情况有多种原因，我只提出以下几点，有补充的可以在下面留言，我补充。

（1）.训练数据分布不均匀，可能你的训练数据某一类别占据了大多数，比如95%的数据为苹果，5%的数据为其他类别，那么模型为了拟合训练数据，则模型会偏袒于把识别结果归属于苹果，而验证集的数据是正常的，那么便会出现高train_acc，低val_acc。

（2）.训练数据没有shuffle，那么整个batch里面将会是同一个类别数据，比如都为苹果的图片，那么训练一个batch，那么模型输出将会往这一类别靠拢，会形成一个很高的acc的假象，但这个模型泛化能力却很低，因为这个模型都只会为了拟合这批同类的数据。

（3）.训练集跟验证集的预处理不一致，这个是细节问题，输入的图片分布不一致，那么必然会影响到验证结果。

（4）.模型过于复杂，造成过拟合现象，特别是在于训练数据集不多的情况下，更容易出现过拟合。

（5）.这个也是最难发现的，就是过大的batch_size，造成训练前期，模型还未收敛，出现很高的train_acc，却有很低的val_acc，亲测，在120个类别，参数只有七万的分类模型中，在batch-size等于64的情况下，在第二个epoch时，train_acc达到80%，val_acc却只有6%，train_loss跟val_loss也是相差很大，而在batch_size在等于8的情况下，在第二个epoch，train_acc跟val_acc皆能达到60%，且还有上升的趋势。至于为什么，个人认为，模型在大的batch_size的情况下，模型泛化能力下降，且更难拟合，每个epoch所包含的step也更少，且在adam的优化算法，前期的学习率较高，模型出现了振荡，一直在局部最优值徘徊，具体原因不知。

接下来分析下，batc_size对模型的影响：

large batch_size:

好处：训练的更快，每一step都包含更多的训练集，模型准确率会更高，不容易受到噪声的影响，稳定性更好。

small batch_size:

好处：不容易陷入局部最优，泛化能力更强。

总结：

（1）.large batch_size，虽然训练模型的训练误差会更低，但往往在execute的时候，效果却不尽人意。

（2）.在时间允许的情况下，建议batch_size在32或以下。

以上这篇keras实现多GPU或指定GPU的使用介绍就是小编分享给大家的全部内容了，希望能给大家一个参考，也希望大家多多支持猪先飞。

[!--infotagslink--]

上一篇: python代码区分大小写吗

下一篇: python代码中怎么换行

Linux安装Pytorch1.8GPU(CUDA11.1)的实现
这篇文章主要介绍了Linux安装Pytorch1.8GPU(CUDA11.1)的实现，文中通过示例代码介绍的非常详细，对大家的学习或者工作具有一定的参考学习价值，需要的朋友们下面随着小编来一起学习学习吧...2021-03-25
在Keras中利用np.random.shuffle()打乱数据集实例
这篇文章主要介绍了在Keras中利用np.random.shuffle()打乱数据集实例，具有很好的参考价值，希望对大家有所帮助。一起跟随小编过来看看吧...2020-06-16
解决在keras中使用model.save()函数保存模型失败的问题
这篇文章主要介绍了解决在keras中使用model.save()函数保存模型失败的问题，具有很好的参考价值，希望对大家有所帮助。一起跟随小编过来看看吧...2020-05-21
Pytorch如何切换 cpu和gpu的使用详解
这篇文章主要介绍了Pytorch如何切换 cpu和gpu的使用详解，文中通过示例代码介绍的非常详细，对大家的学习或者工作具有一定的参考学习价值，需要的朋友们下面随着小编来一起学习学习吧...2021-03-01
win10安装tensorflow-gpu1.8.0详细完整步骤
这篇文章主要介绍了win10安装tensorflow-gpu1.8.0详细完整步骤，本文给大家介绍的非常详细，具有一定的参考借鉴价值,需要的朋友可以参考下...2020-04-22
解决Keras 中加入lambda层无法正常载入模型问题
这篇文章主要介绍了解决Keras 中加入lambda层无法正常载入模型问题，具有很好的参考价值，希望对大家有所帮助。一起跟随小编过来看看吧...2020-06-17
keras.layer.input()用法说明
这篇文章主要介绍了keras.layer.input()用法说明，具有很好的参考价值，希望对大家有所帮助。一起跟随小编过来看看吧...2020-06-17
keras的三种模型实现与区别说明
这篇文章主要介绍了keras的三种模型实现与区别说明，具有很好的参考价值，希望对大家有所帮助。一起跟随小编过来看看吧...2020-07-04
完美解决TensorFlow和Keras大数据量内存溢出的问题
这篇文章主要介绍了完美解决TensorFlow和Keras大数据量内存溢出的问题，具有很好的参考价值，希望对大家有所帮助。一起跟随小编过来看看吧...2020-07-04
利用keras使用神经网络预测销量操作
这篇文章主要介绍了利用keras使用神经网络预测销量操作，具有很好的参考价值，希望对大家有所帮助。一起跟随小编过来看看吧...2020-07-08
pytorch 实现张量tensor,图片,CPU,GPU,数组等的转换
今天小编就为大家分享一篇pytorch 实现张量tensor,图片,CPU,GPU,数组等的转换，具有很好的参考价值，希望对大家有所帮助。一起跟随小编过来看看吧...2020-04-27
python 详解如何使用GPU大幅提高效率
CuPy是一个开源矩阵库，使用NVIDIA CUDA加速。CuPy使用Python提供GPU加速计算。CUPY使用CUDA相关库，包括 CuBLAS、CUDNN、Curand、CuoSver、CuPaSeSE、Cufft和NCCL，以充分利用GPU架构...2021-11-10
使用keras实现孪生网络中的权值共享教程
这篇文章主要介绍了使用keras实现孪生网络中的权值共享教程，具有很好的参考价值，希望对大家有所帮助。一起跟随小编过来看看吧...2020-06-11
详解tf.device()指定tensorflow运行的GPU或CPU设备实现
这篇文章主要介绍了详解tf.device()指定tensorflow运行的GPU或CPU设备实现，文中通过示例代码介绍的非常详细，对大家的学习或者工作具有一定的参考学习价值，需要的朋友们下面随着小编来一起学习学习吧...2021-02-20
PyTorch 多GPU下模型的保存与加载(踩坑笔记)
这篇文章主要介绍了PyTorch 多GPU下模型的保存与加载(踩坑笔记)，文中通过示例代码介绍的非常详细，对大家的学习或者工作具有一定的参考学习价值，需要的朋友们下面随着小编来一起学习学习吧...2021-03-09
keras:model.compile损失函数的用法
这篇文章主要介绍了keras:model.compile损失函数的用法，具有很好的参考价值，希望对大家有所帮助。一起跟随小编过来看看吧...2020-07-02
keras输出预测值和真实值方式
这篇文章主要介绍了keras输出预测值和真实值方式，具有很好的参考价值，希望对大家有所帮助。一起跟随小编过来看看吧...2020-06-28
tensorflow -gpu安装方法（不用自己装cuda，cdnn）
这篇文章主要介绍了tensorflow -gpu安装，史上最新最简单的途径（不用自己装cuda，cdnn）,非常不错，具有一定的参考借鉴价值，需要的朋友可以参考下...2020-04-22
keras实现基于孪生网络的图片相似度计算方式
这篇文章主要介绍了keras实现基于孪生网络的图片相似度计算方式，具有很好的参考价值，希望对大家有所帮助。一起跟随小编过来看看吧...2020-06-12
keras实现调用自己训练的模型,并去掉全连接层
这篇文章主要介绍了keras实现调用自己训练的模型,并去掉全连接层，具有很好的参考价值，希望对大家有所帮助。一起跟随小编过来看看吧...2020-06-10

keras实现多GPU或指定GPU的使用介绍

相关文章

阁下可能感兴趣的内容

推荐阅读