批量学习与在线学习概述

一、批量学习(batch learning)

在监督学习的批量方法中,多层感知器的突出权值的调整在训练样本集合的所有N个例子都出现后进行,这构成了训练的一个回合。换句话说,批量学习的代价函数是由平均误差能量定义的。多层感知器的突触权值的调整是以回合-回合为基础的。相应地,学习曲线的一种实现方式是通过描绘平均误差能量对回合数的图形而得到,对于训练的每一个回合,训练样本集合的样例是随机选取的。学习曲线通过对足够大量的这样实现的总体平均来计算,这里每次实现是在随机选取不同初始条件下完成的。这一特点符合交叉验证的规律,实验中的实验集、验证集、测试集一般都是批量处理的典例。

 优点:

  • (1)消除样本顺序的影响
  • (2)对梯度向量的精确估计,因此,在简单条件下,保证了这一方法最速下降到局部极小点的收敛性。
  • (3)学习的并行性。

 缺点:

  • (1)有着存储需求,需要一次性将所有的训练集加载到内存,这个显然不适合真实世界中的问题。
  • (2)不适合高维数据的处理

二、在线学习(online learning)

在监督学习的在线方法下,对于多层感知器突触权值的调整是以样例-样例为基础的,用来最小化的代价函数是全体瞬时误差能量。和批量学习一样,在线学习的学习曲线是通过足够大量的随机选取的初始条件上的总体平均来计算的。对于给定的网络结构,在线学习下获得的学习曲线和批量学习下获得的学习曲线有着很大的不同。

给定训练样本以随机的方式呈现给网络,在线学习的使用使得在多维权值空间中的搜索事实上是随机的;正是由于这个原因,在线学习方法有时被称为随机方法。

优点:

  • (1)容易执行
  • (2)对于大规模和困难模式分类问题它提供有效解。
  • (3)随机性使得不容易陷入局部极值点
  • (4)存储量少得多

留下评论

您的邮箱地址不会被公开。 必填项已用 * 标注