博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
R语言聚类方法&主要软件包-K-means
阅读量:6250 次
发布时间:2019-06-22

本文共 592 字,大约阅读时间需要 1 分钟。

主要4中软件包

stas:主要包含基本统计函数。

cluster:用于聚类分析。

fpc:含聚类算法函数(固定聚类、线性回归聚类等)。

mclust:处理高斯分布混合模型,通过EM算法实现聚类、分类及密度估计等。

kmeans()函数用法:

kmeans(x,centers,iter.max=10,nstart=1,algorithm=c("Hartigan-Wong","Lloyd","For-gy","MacQueen")

library("xlsx")

accountinfo <- read.xlsx("account.xlsx",1,header = TRUE) #载入数据
dim(accountinfo)
head(accountinfo)

account_km <- kmeans(accountinfo[,-1],centers = 3) #自定义为3类

print(account_km) #输出结果

3类样本数分别为:43002,12509,2294

中心点坐标为:

1 1.468350 102.2073

2 4.070589 396.2660
3 8.369224 937.3692

组内平方和为:197660145 152158338 254995794

 

转载于:https://www.cnblogs.com/shain/p/6121802.html

你可能感兴趣的文章
Eonasdan bootstrap datetimepicker 使用记录
查看>>
win7 64位系统下读写access数据库以及安装了office32位软件再安装64位odbc的方法
查看>>
网络最大流算法—Dinic算法及优化
查看>>
linux中iptables的用法
查看>>
MongoDB的简单操作
查看>>
C# 合并Excel工作表
查看>>
《机器学习实战》2.2.2分析数据:使用matplotlib创建散点图
查看>>
Linux如何查看当前占用CPU或内存最多的几个进程
查看>>
bit,byte,char,位,字节,字符 的区别
查看>>
Docker 容器入门
查看>>
[LeetCode] Pyramid Transition Matrix 金字塔转变矩阵
查看>>
几种查看CentOS系统版本号和位数的方法
查看>>
数字签名到底是什么鬼?
查看>>
GoldenGate实时投递数据到大数据平台(7)– Apache Hbase
查看>>
python安装h5py
查看>>
异常处理器
查看>>
生命的活力-负熵-秩序-结构
查看>>
[LeetCode] Number of Distinct Islands II 不同岛屿的个数之二
查看>>
Java NIO Overview
查看>>
MD5 和的价值体现在哪里,它是用来做什么的?
查看>>