基于训练集的代理模型生成算法(DROP3、AGG)

DROP3算法

目的:保留类边界上的实例,去除类内部的实例,构造代理训练集
主要思想:利用KNN算法及排序来去除噪音实例

算法步骤

①先去除训练集上所有KNN算法错误分类的特征

②对于二分类来说,计算每个实例与最近的其它类的实例距离,并排序

③去除上述距离较远的实例

④去除不影响其它实例预测结果的实例

示例

Agglomerative Clustering

目的:解决DROP3算法的问题来构造代理模型(摒弃了KNN算法)

自底向上聚类

首先每个实例自成一类,两个最近的合并为一类,选出每个类的中心实例,加入代理训练集模型。(类的个数等于代理训练集实例大小,用户设置)

2 评论

  1. 你好 , 这位朋友。
    我可以知道 Agglomerative Clustering 这个算法是怎么看吗? 我看不懂呢。 可以教导我吗? 谢谢你

留下评论

您的邮箱地址不会被公开。 必填项已用 * 标注