Kmeans如何应用于类别不平衡的数据上(用kmeans做工具)?-灵析社区

小青梅

Kmeans如何应用于减轻类别不平衡的数据上,然后用来训练其他模型? **用kmeans做工具,不是用不平衡数据区训练kmeans!** 举例: 训练数据中A,B,C,D,其中A B类别很多 CD很少; 预测数据中全部是A,C。 此时用kmeans直接把ABCD 聚类成2个? 查看过一些博客,基本上都是水文,没多少有用价值。。。

阅读量:14

点赞量:0

问AI
是的,是直接改变训练数据数据分布的。 只保留majority类别,其中还有imbalanced-learn这个库帮助可以实现。里面还有其他各种治疗方法,也可以参考。 具体可以看这篇:"https://zhuanlan.zhihu.com/p/640220466" (https://link.segmentfault.com/?enc=CwMTbFWgd%2BQycR9GMYzOWQ%3D%3D.4cidPOmoe3BLq4tQmWLZB93K0sACjFRj8w4vZHVe9zMScrkXU%2BN6vPPIDgfhOf9V)