不均衡、边界模糊的机器学习技术

不均衡、边界模糊的机器学习技术

深度学习方面一般采用重赋权、重采样、多专家等技术,将特征提取器与分类器解耦训练;而传统机器学习的发展主要集中在代价敏感学习与集成学习方法。大多数真实世界的应用中,数据不均衡分布问题较为严重,尤其是在疾病预测、设备异常检测等领域,采集到的数据极度不均衡,且在这些问题中我们关注的类别常为少数类(如疾病患者、故障机器等),传统的方法在这种数据不均衡问题上分类性能下降较明显,且对于少数类的分类效果不好。该项目针对以上问题,结合自适应下采样与集成学习,开发了一种不均衡、边界模糊的机器学习技术,使分类算法更多的关注少数类别的有效信息,筛除噪声样本,增加模型鲁棒性的同时提高分类算法在样本不均衡问题下的性能。我们提出的技术具有广泛适用性,可应用于医疗与大健康、故障检测等多个领域。

联系方式:

北京科大科技园

010-62333830,62335841,62335665,62333626