当前位置:首页 > 科技文档 > 互联网 > 正文

基于DBSCAN聚类的不平衡数据集过采样方法

计算机仿真 页数: 5 2023-10-15
摘要: 在网络流量检测中,经常出现数据类别不平衡的情况,为改善不平衡数据集的分类效果,提出一种基于DBSCAN聚类的过采样方法。方法首先对少数类数据进行聚类,之后根据簇的稀疏程度以及簇中少数类样本与多数类样本之间的距离,为每一个少数类样本点分配过采样比例,并生成合成样本。为进一步检验该算法,选择CIC-IDS2017数据集进行测试,并与随机过采样和SMOTE算法进行对比,实验结果表明,... (共5页)

开通会员,享受整站包年服务立即开通 >