• 信息通信领域高质量科技期刊分级目录入选期刊
  • 中国期刊全文数据库(CJFD) 全文收录期刊
  • 中国学术期刊综合评价数据库(CAJCED) 统计源期刊
  • 中国学术期刊数据库(COJ)万方数据数字化期刊群
  • 中文科技期刊数据库(维普资讯)

1. 2023, 36(6): 0. doi:

综述

基于初始质心的 K-Means 算法优化

何嘉伦,马 冲

关键词: K-Means 算法;欧氏距离;SSE;轮廓系数;方差比准则;DB;

中图分类号:TP311.13

文献标识码:A

文章编号:2096-9759(2023)06-0069-05

作者简介

何嘉伦(2001-),男,湖北随州人,本科,主要研究方向:软件工程。
 

摘要

由于传统 K-Means 聚类算法对初始质心的赋值具有随机性,使得模拟结果有着极大的波动。针对这一问题,文章采用均分法,首先将样本数据清洗,将偏差值较大的数据筛除,然后把处理后的样本数据在二维平面内均匀划分成若干等分,进行排序归纳计算出最佳初始质心用于聚类算法的初次迭代,并调用 SSE 等度量指标对迭代的质心进行更新,最后将样本数据划分成有意义的簇。实验结果表明,文章针对 K-Means 算法的优化在一定程度上减少了质心的迭代次数,节省了时间同时提高了准确率,对初始质心赋值优化具有有效性和实用性的特点。
 

本文引用格式