【摘要】:人们在分析问题解决问题时,常常需要将所研究的对象进行分类,然后分别加以研究,从而加深对事物的认识.在早期的分类学中,主要依靠经验和专业知识进行分类.例如,人类可以根据肤色的不同,分为白种人、红种人、黄种人和黑人等;学校可以按教学内容的程度分为大学、中学、小学和幼儿园;也可以依照办学经费的主要来源分为公办学校和私立学校;还可以根据学习时间的区别分为全日制学校和业余学校等.随着人们对自然界和人类社会的
聚类分析方法_统计中的智慧
人们在分析问题解决问题时,常常需要将所研究的对象进行分类,然后分别加以研究,从而加深对事物的认识.在早期的分类学中,主要依靠经验和专业知识进行分类.例如,人类可以根据肤色的不同,分为白种人、红种人、黄种人和黑人等;学校可以按教学内容的程度分为大学、中学、小学和幼儿园;也可以依照办学经费的主要来源分为公办学校和私立学校;还可以根据学习时间的区别分为全日制学校和业余学校等.随着人们对自然界和人类社会的认识不断加深,对分类学的要求越来越高.有时仅凭经验和专业知识已不能准确地进行分类,于是将数学引入到分类学中,逐渐形成了“聚类分析”的学问.例如,在一个股票市场中,有上千万种不同的股票,每一种股票都有许多数据,如价格、市盈率、成交量、每股净资产、公司利润等,要求将特征相近的股票聚集在一起,分成若干类型.这就是一个聚类分析问题.
所谓聚类分析(cluster analysis),就是根据“物以类聚”的原则,运用数学工具将特征比较接近的样品聚集在一起成为一类.
我们欲将特征相近的事物归为一类,就需要在数学上给出一种度量,用来测量所谓的“相近”,即用一个量的大小来测量事物之间的相近程度.如果将每个事物看作数学空间中的一个点,并在这个空间中规定两点之间的距离,就可用距离大小来表示事物之间的相近程度,分类时则将距离小的点归为一类.这就是聚类分析方法的基本思想.
聚类分析的方法很多,下面介绍两种常用的方法.
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。