基于k-means算法聚类问题的研究

2020-10-20 21:32张勤
数码设计 2020年8期
关键词:聚类算法可行性

张勤

摘要:K-means算法是一种分类的聚类算法,通过这种算法,对药品销售数据进行处理,把销量较好的一组显示给用户,实现药品销售排行功能,以方便用户的采购,也便于销售商掌握销售规律,采取相应的措施。这样也就完成K-means聚类算法的实现过程。

关键词:聚类算法;可行性;聚类算法的实现过程

中图分类号:TP301.6 文献标识码:A 文章编号:1672-9129(2020)08-0182-01

1 問题的提出

当今是一个信息爆炸的时代,在生产和生活的各个方面,每天都有形形色色的海量数据不断出现,这些数据背后都隐藏着有价值的信息。这些信息 需要被挖掘才能体现价值,聚类是这个过程中最常用到的一个技术,所以聚类被越来越多地运用,得到了越来越多的重视。例如,在药品销售方面,既存在销路一般的滞销药,也有着销售速度极快的畅销药。而倘若能够准确把握其中的数据信息,采取聚类分析的方法来对相关药品实施统一化的销售处理,就能够让药品的处理率得到有力提升,而且还可以通过对药品销售规律的把控,科学化地处理多类别药品。

2 K-means聚类算法

客观地说,聚类分析属于一种以挖掘数据为核心的功能,其能够充当为一种获取数据分布情况的工具,为使用者正确认知类别对象特点,进而进行集中化的类别分析提供数据支持。同时,其作为当前较为时兴的一种算法,能够对注入市场营销、生物学、空间数据技术、机器学习、统计学以及数据挖掘等多个领域提供便利。由于各领域都存有数据储存量庞大的数据库。故此,聚类分析意境逐步发展成数据挖掘领域中一个极其重要的研究课题。对于k-means 算法而言,其接受输入量为k;然后以k为聚类划分n各数据对象,进而获得相应的聚类满足:不同聚类中各个对象的相似度不高,而同一聚类中各个对象则有着极高的相似度。而其中的相似度,则是以聚类对象的“中心对象”,也就是均值来计算而得。

3 K-means聚类算法的可行性

聚类算法在各个方面都有所应用,在生物学上对于基因的聚类,分别同一物种;在上市分析上帮助销售人员选择客户群;在房地产选址方面也能选择较好的房源;在居民阶梯电量制定方法双眼皮也有应用。现如今药品的数量、种类繁多,单独去了解一个或一类药品费时费力,而聚类K-means正是分类的算法,在此以销量作为分组的依据,把销量较好的显示给用户。销量较差的提示给管理员,采取相应的措施。所以该系统使用K-means算法也是可行的。

4 K-means聚类算法的基本步骤

(1)从数据中选择k个对象作为初始聚类中心;

(2)计算每个聚类对象到聚类中心的距离来划分;

(3)再次计算每个聚类中心

(4)计算标准测度函数,到达到最大迭代次数,则停止,否则,继续操作。

5 K-means聚类算法的实现过程

首先对所选数据进行预处理和标准化,做预处理是因为数据的“不纯净”,提高数据的挖掘质量,节约数据挖掘的时间;数据标准化是为了压缩数据,提高数据的准确性和有效性。标准化的方法为:已知有n个药品,设第i个药品,第j个属性的值为Xij,

下面是选择的部分数据:

经过K-means聚类后可得到两大药品分类,第一类编号为:3、4、5、6、7;第二类编号为:8、9、11、12、13。

结语:用数据聚类K-means算法,通过聚类分析把销售数据分为几组,把销量好的显示给用户,便于采购。销量不好的反馈给管理者,以便采取措施,调整销售策略。下一步将软件的开发和完善。

参考文献:

[1] 阿霍. 计算机算法设计与分析(英文版)[M].北京:机械工业出版社,2006.

[2] 任恒妮. 大数据 K-means 聚类算法的研究与应用[J].信息技术2019(11)

[3] 王晓东.计算机算法设计与分析[M].北京:电子工业出版社,2018.

[4] 王晓云,陈业纲.计算机算法设计、分析与实现[M].北京:科学出版社,2012.

猜你喜欢
聚类算法可行性
IPTV 8K超高清建设可行性分析与建议
螺旋CT对食管癌手术的可行性评价
浅谈出行及服务MaaS方案在XX市实施的必要性和可行性
五家渠市交通信号控制系统可行性改造研究
数据挖掘算法性能优化的研究与应用
K—Means聚类算法在MapReduce框架下的实现
基于K?均值与AGNES聚类算法的校园网行为分析系统研究
基于改进的K_means算法在图像分割中的应用
大规模风电场集中接入对电力系统小干扰稳定的影响分析
可行性指南丝绸衬衫款