AI:如何训练机器学习的模型

 更新时间:2021年4月16日 00:01  点击:2490

1.Training: 如何训练模型

一句话理解机器学习一般训练过程 :通过有标签样本来调整(学习)并确定所有权重Weights和偏差Bias的理想值。

训练的目标:最小化损失函数

(损失函数下面马上会介绍)

机器学习算法在训练过程中,做的就是:检查多个样本并尝试找出可最大限度地减少损失的模型;目标就是将损失(Loss)最小化

在这里插入图片描述

上图就是一般模型训练的一般过程(试错过程),其中

  • 模型: 将一个或多个特征作为输入,然后返回一个预测 (y') 作为输出。为了进行简化,不妨考虑一种采用一个特征并返回一个预测的模型,如下公式(其中b为 bias,w为weight)

在这里插入图片描述

  • 计算损失:通过损失函数,计算该次参数(bias、weight)下的loss。
  • 计算参数更新:检测损失函数的值,并为参数如bias、weight生成新值,以降低损失为最小。

例如:使用梯度下降法,因为通过计算整个数据集中w每个可能值的损失函数来找到收敛点这种方法效率太低。所以通过梯度能找到损失更小的方向,并迭代。

举个TensorFlow代码栗子,对应上面公式在代码中定义该线性模型:

y_output = tf.multiply(w,x) + b

假设该模型应用于房价预测,那么y_output为预测的房价,x为输入的房子特征值(如房子位置、面积、楼层等)

2. Loss Function:损失和损失函数

损失是一个数值 表示对于单个样本而言模型预测的准确程度。

如果模型的预测完全准确,则损失为零,否则损失会较大。

训练模型的目标是从所有样本中找到一组平均损失“较小”的权重和偏差。

损失函数的目标:准确找到预测值和真实值的差距

在这里插入图片描述

如图 红色箭头表示损失,蓝线表示预测。明显左侧模型的损失较大;右侧模型的损失较小

要确定loss,模型必须定义损失函数 loss function。例如,线性回归模型通常将均方误差用作损失函数,而逻辑回归模型则使用对数损失函数。

正确的损失函数,可以起到让预测值一直逼近真实值的效果,当预测值和真实值相等时,loss值最小。

举个TensorFlow代码栗子,在代码中定义一个损失loss_price 表示房价预测时的loss,使用最小二乘法作为损失函数:

loss_price = tr.reduce_sum(tf.pow(y_real - y_output), 2)

这里,y_real是代表真实值,y_output代表模型输出值(既上文公式的y' ),因为有的时候这俩差值会是负数,所以会对误差开平方,具体可以搜索下最小二乘法公式

3. Gradient Descent:梯度下降法

理解梯度下降就好比在山顶以最快速度下山:

好比道士下山,如何在一座山顶上,找到最短的路径下山,并且确定最短路径的方向

原理上就是凸形问题求最优解,因为只有一个最低点;即只存在一个斜率正好为 0 的位置。这个最小值就是损失函数收敛之处。

在这里插入图片描述

通过计算整个数据集中 每个可能值的损失函数来找到收敛点这种方法效率太低。我们来研究一种更好的机制,这种机制在机器学习领域非常热门,称为梯度下降法。

梯度下降法的目标:寻找梯度下降最快的那个方向

梯度下降法的第一个阶段是为 选择一个起始值(起点)。起点并不重要;因此很多算法就直接将 设为 0 或随机选择一个值。下图显示的是我们选择了一个稍大于 0 的起点:

在这里插入图片描述

然后,梯度下降法算法会计算损失曲线在起点处的梯度。简而言之,梯度是偏导数的矢量;它可以让您了解哪个方向距离目标“更近”或“更远”。请注意,损失相对于单个权重的梯度(如图 所示)就等于导数。

请注意,梯度是一个矢量,因此具有以下两个特征:

  • 方向
  • 大小

梯度始终指向损失函数中增长最为迅猛的方向。梯度下降法算法会沿着负梯度的方向走一步,以便尽快降低损失

为了确定损失函数曲线上的下一个点,梯度下降法算法会将梯度大小的一部分与起点相加

在这里插入图片描述

然后,梯度下降法会重复此过程,逐渐接近最低点。(找到了方向)

  • 随机梯度下降法SGD:解决数据过大,既一个Batch过大问题,每次迭代只是用一个样本(Batch为1),随机表示各个batch的一个样本都是随机选择。

4. Learning Rate:学习速率

好比上面下山问题中,每次下山的步长。

因为梯度矢量具有方向和大小,梯度下降法算法用梯度乘以一个称为学习速率(有时也称为步长)的标量,以确定下一个点的位置。这是超参数,用来调整AI算法速率

例如,如果梯度大小为 2.5,学习速率为 0.01,则梯度下降法算法会选择距离前一个点 0.025 的位置作为下一个点。

超参数是编程人员在机器学习算法中用于调整的旋钮。大多数机器学习编程人员会花费相当多的时间来调整学习速率。如果您选择的学习速率过小,就会花费太长的学习时间:

在这里插入图片描述

继续上面的栗子,实现梯度下降代码为:

train_step = tf.train.GradientDescentOptimizer(0.025).minimize(loss_price)

这里设置梯度下降学习率为0.025, GradientDescentOptimizer()就是使用的随机梯度下降算法, 而loss_price是由上面的损失函数获得的loss

至此有了模型、损失函数以及梯度下降函数,就可以进行模型训练阶段了:

Session = tf.Session()
Session.run(init)
for _ in range(1000):
	Session.run(train_step, feed_dict={x:x_data, y:y_data}) 

这里可以通过for设置固定的training 次数,也可以设置条件为损失函数的值低于设定值,

x_data y_data则为训练所用真实数据,x y 是输入输出的placeholder(代码详情参见TensorFlow API文档)

5. 扩展:BP神经网络训练过程

BP(BackPropagation)网络的训练,是反向传播算法的过程,是由数据信息的正向传播和误差Error的反向传播两个过程组成。

反向传播算法是神经网络算法的核心,其数学原理是:链式求导法则

  • 正向传播过程:

输入层通过接收输入数据,传递给中间层(各隐藏层)神经元,每一个神经元进行数据处理变换,然后通过最后一个隐藏层传递到输出层对外输出。

  • 反向传播过程:

正向传播后通过真实值和输出值得到误差Error,当Error大于设定值,既实际输出与期望输出差别过大时,进入误差反向传播阶段:

Error通过输出层,按照误差梯度下降的方式,如上面提到的随机梯度下降法SGD,反向修正各层参数(如Weights),向隐藏层、输入层逐层反转。

通过不断的正向、反向传播,直到输出的误差减少到预定值,或到达最大训练次数。

在这里插入图片描述

到此这篇关于AI:如何训练机器学习的模型的文章就介绍到这了,相信对你有所帮助,更多相关机器学习内容请搜索猪先飞以前的文章或继续浏览下面的相关文章,希望大家以后多多支持猪先飞!

[!--infotagslink--]

相关文章

  • AI虽非消除虚假新闻的完美解决方案 但能减轻这个问题

    【腾讯科技编者按】美国风投公司 Verizon Ventures 的董事大卫·法莫拉里(David Famolari)今日在科技博客 Venturebeat 上撰文称,虚假新闻问题因为跟总统大选牵连在一起而受到越来越多的人关注,现在很多公司开始尝试利用 AI(人工智能)技术来解决这个问题,这虽然并非最完美的解决方案,但是或许能够在一定程度上减轻这个问题。原文如下:...2017-07-06
  • AI:如何训练机器学习的模型

    这篇文章主要介绍了是如何进行机器学习的模型的训练,全文逻辑清晰,简单易懂,如果您正在学习机器学习那么可以参考下,说不定会有不一样的收货...2021-04-16
  • 联想成立人工智能实验室 AI专家徐飞玉加盟并负责研发

    3 月 23 日消息,联想研究院人工智能实验室于近日正式成立。联想同时宣布,德国人工智能研究中心技术领袖徐飞玉博士加盟联想,作为副总裁负责联想研究院人工智能实验室的研发工作。...2017-07-06
  • asp.net c# 调用百度pai实现在线翻译,英文转中文

    本文详细介绍asp.net c# 调用百度pai 实现在线翻译以及英文转中文实现代码,需要了解的朋友可以参考下...2021-09-22
  • 利用Python如何制作贪吃蛇及AI版贪吃蛇详解

    这篇文章主要给大家介绍了关于利用Python如何制作贪吃蛇及AI版贪吃蛇的相关资料,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习学习吧...2020-08-25
  • Python 机器学习工具包SKlearn的安装与使用

    Sklearn(全称 SciKit-Learn),是基于 Python 语言的机器学习工具包。本文将简单的介绍SKlearn安装与使用,想要入坑机器学习的同学可以参考下...2021-05-15
  • 新站靠baidu之我见

    最近我弄了两个小站,在前面说了些我的推广经验心得,今天我再把我这几天发现的问题总结给大家,不足之处请大家多多指点。 搜索蜘蛛论:每个搜索都有一个庞大的数据库,每次蜘蛛...2017-07-06
  • C语言手把手教你实现贪吃蛇AI(中)

    这篇文章主要为大家详细介绍了C语言手把手教你实现贪吃蛇AI的相关资料,具有一定的参考价值,感兴趣的小伙伴们可以参考一下...2020-04-25
  • C++简单五子棋的AI设计实现

    这篇文章主要为大家详细介绍了C++简单五子棋的AI设计实现,具有一定的参考价值,感兴趣的小伙伴们可以参考一下...2020-04-25
  • java学习DongTai被动型IAST工具部署过程

    被动型IAST被认为是DevSecOps测试阶段实现自动化安全测试的最佳工具,而就在前几天,洞态IAST正式开源了,这对于甲方构建安全工具链来说,绝对是一个大利好...2021-10-15
  • 深度学习详解之初试机器学习

    机器学习可应用在各个方面,本篇将在系统性进入机器学习方向前,初步认识机器学习,利用线性回归预测波士顿房价,让我们一起来看看吧...2021-04-15
  • baidu cpa广告平台

    8月6日消息,经过2个多月的试运行,百度联盟即日正式推出“按效果付费”的CPA广告平台。目前,已有包括当当网、skype在内的9家品牌广告,正通过这个平台被推送至百...2017-07-06
  • python 使用百度AI接口进行人脸对比的步骤

    这篇文章主要介绍了python 使用百度AI接口进行人脸对比的步骤,帮助大家更好的理解和学习使用python,感兴趣的朋友可以了解下...2021-03-17
  • 基于C++实现五子棋AI算法思想

    这篇文章主要为大家详细介绍了基于C++实现五子棋AI算法思想,具有一定的参考价值,感兴趣的小伙伴们可以参考一下...2020-04-25
  • C语言手把手教你实现贪吃蛇AI(下)

    这篇文章主要手把手教你实现C语言版贪吃蛇AI,具有一定的参考价值,感兴趣的小伙伴们可以参考一下...2020-04-25
  • 如何让baidu快速收录新站

    域名的选择学问大了,域名的选择若是恰到好处,益处甚大,还是老生常谈的一个话题 .网站名称   在网站标题上作文章,前提是你很有想象力和创造力,标题最好不和别人重复,...2017-07-06
  • Python机器学习之决策树

    这篇文章主要介绍了Python机器学习之决策树,文中有非常详细的代码示例,对正在学习python的小伙伴们有非常好的帮助,需要的朋友可以参考下...2021-04-30
  • C语言手把手教你实现贪吃蛇AI(上)

    这篇文章主要介绍了C语言手把手教你实现贪吃蛇AI,具有一定的参考价值,感兴趣的小伙伴们可以参考一下...2020-04-25
  • Python基于百度AI实现抓取表情包

    本文先抓取网络上的表情图像,然后利用百度 AI 识别表情包上的说明文字,并利用表情文字重命名文件,感兴趣的小伙伴们可以参考一下...2021-06-27
  • C#机器入门学习之判断日报是否合格详解

    这篇文章主要给大家介绍了关于C#机器入门学习之判断日报是否合格的相关资料,文中通过示例代码介绍的非常详细,对大家的学习或者使用c#具有一定的参考学习价值,需要的朋友们下面来一起学习学习吧...2020-06-25