04.16 用EXCEL写算法分析？过程很复杂，结果很感人！_其它 _ 頭條網

那天把别人大牛写的方法拿过来做了个总结，然后有让小伙伴觉得EXCEL可能是个建模编程的软件，关键是当时我当时还**的回复了下次出个建模分析的教程。

今天我就厚着脸皮尝试一把，胆战心惊的写这篇用EXCEL做的建模分析的。。。。探索。嗯，今天不能称其为教程。各位看官要是略懂一二，碰到老王我写的有任何有误的地方，请轻喷，毕竟我还是要住在你隔壁，小心我把墙砸了啊喂。

好了，言归正传，今天尝试用EXCEL做的建模是一种比较常用的聚类分析算法，叫K均值聚类，所谓聚类呢就是“物以类聚，人以群分”的意思，将相似的物品聚集到一起作为同一类别。比如老王我和楼上老李喜欢打牌，所以会聚集一帮牌友时不时搓个麻将，你喜欢看点动作片，所以活跃在各大动作片论坛。因为我们的类别不同所以你要是问我有哪些动作片明星，我肯定会告诉你，什么苍井空,川滨奈美,堤莎也加,町田梨乃,二阶堂仁美,饭岛爱,饭田夏帆,饭冢友子,芳本叶月,冈崎结由,冈田丽奈,高木萌美,高田礼子,高原流美,宫本真美,宫岛司的，我一个都知道的。

那什么叫做K均值聚类？K均值聚类的过程是啥？这些个问题我就不去详细解释？大家尽可以去搜索（嘘！说得多，错的多，蛤蛤蛤）。

- - - - - 开始一本正经瞎扯- - - - -

这是一个数据建模的过程，所以我们从数据探索开始：

这里我选的数据是手机用户的通话和流量使用量：

一共有100条数据，都是0-1之间，因为我已经做了min-max归一化处理。

我们先来看一下这些数据的分布情况，来个散点图最适合：

数据看起来是有些特点，有一些通话很多但是流量很少，也有一些流量很多但是通话很少，剩余的一些通话和流量都有但是貌似集中为两块。这是通过散点图初步得到的信息。

我们要做的聚类就是将这些数据通过科学的方法聚集成几类，这里所用的科学方法就是这个叫做“K均值聚类”的算法，其中K就是聚类的类别数，根据上面散点图的信息，我们可以尝试将K设为4.

下面就是动态演示聚类过程了：

这里我将聚类的类别标签显示在对应的右边一列，另外在E-F列显示出了4个簇的中心点坐标，这有助于后续的解释分析。

对于聚好的类别，我们同样还是做成散点图来观察：

对于这个图中的4个类别，我们逐一结合业务简单分析一下：

1类中心点（0.09，0.25）表示通话较少，流量一般。这种是普通用户，通话不多，流量也不是特别多那种。比如通话最多的是快递外卖啊，流量不多是因为多数时间在家里；

2类中心点（0.07，0.62）表示通话很少，流量很多。这种是流量型用户，平时消耗最多的是流量，一般是年轻人居多，首选视频语音通话，而且有追剧、看直播等很多消耗流量的地方，比如随便就开始直播吃个饭啊；

3类中心点（0.77，0.03）表示通话很多，流量很少。这种用户值得我们思考啊，这年头谁还不用流量啊！但是偏偏就有些人不需要流量，比如让你猜猜他是谁的，推荐你买股票、买黄金、买房子的。

4类中心点（0.41，0.51）表示通话较多，流量较多。这种商务人士居多，商务人士的电话肯定比普通人高不少，流量这块因为外出等缘故，当然也有可能因为本身套餐流量较多的缘故，所以在流量的消耗上也很多。

以上就是通过EXCEL做的一个较为简陋的手机用户聚类分析。当然由于算法本身的问题，可能面对一些数据不能做好很好的聚类效果，也有可能在聚类过程中由于随机选择初始中心点也不能做到较好的收敛，所以。。。哦不好意思，这些不是这里讨论的问题，也不是我能轻易解决的问题。我就是为了尝试下EXCEL做建模运算，只不过其中心酸大概比较了那些轮子造好的软件才知道。

好了，以上就是今天的内容，轻喷。。。不喷的话难道不能点个赞？

哦？你问我源码？这种东西还是私聊吧！

相關文章:

致 敬 平 凡 而 伟 大 #2020.04.04

航海新闻晚读2020.04.04

清明​ 04-04 11:38

网贷逾期日记04.04

2020.04.04 全国哀悼

今天2020-04-04，请把朋友圈留给他们！

2020-04-04。清明节－纪念抗疫烈士和死难同胞。并向英雄们致敬！

浮光掠影 2020-04-04——埃菲尔铁塔、巴勒贝克、头盔金字塔

2020.04.04 中国加油！

双色球017期开奖结果：02 04 07 15 20 27+04

04 怎么判断保险公司和保险顾问给忙碌者的个人保险课

3D建模赛题-04

Cadence的allegro下修铜皮实例-04

【04.22-04.26】嘉兴市国际服务贸易协会秘书处动态

2019.04.27游常熟乡镇品乡村风情

04.16｜每日一练（中译英）

04.12《狗的眼泪》

04.11｜每日一练（改错）

04.08｜每日一练（英译中）

2019-04-05猪价行情

一抱山人日记2019.04.02

[烽禾影像]04.01今日份客片欣赏

04 天地都是灰色，属于我们的秋冬之际

04 结盟筑城｜一说春秋，每天5分钟读透春秋

国家地理付费App每日精选2018-10-04

《中小企业征收拆迁关停维权成果十论》04：从局部征收到整体征收

消费型重疾险都是一年期的？｜真相大白Vol.04

上海地铁：9.04

熊猫头斗图8.04

问卷与量表分析：「04」样本分布特征的频率分析

张强特大中炮对屏风马平炮兑车象棋布局定式「04」布局研究精华

解放战争故事连环画：《红日》04

设计模式-04 门面模式与中介者模式

福建各地推广禁毒微信排行榜（06.04

06.05 每日一图｜2018.06.04

高级维修电工知识试卷0903131-04

2018.04.27昨日交易记录

一周安全事故（2018.04.16-04.22）

04.20 ONO项目周报进展（2018.04.16-2018.04.20)

每日一图｜2018.04.10

实盘日志更新（2018.04.02）

句句经典2018-04-01

UC002合同陷阱-04 换个角度看问题

04 沉默没问题的，沉默很正常的

20170508 INS 04

05.05 20170505 INS 04

20170430 INS 04

沈巍先生杂谈（358）说好的快手不倒，陪伴到老呢？个个都是戏精

出海奋斗是有胆识后浪的更优选项

甲有5套房，不上班，收房租；乙有1套房，上班赚工资；丙租房子.

每逢佳节被相亲，单身青年看这里！

为珠峰“量身高”，为啥要人上去？

我省获国家局通报表扬

湖南名字最尴尬的城市，90%的人都会想歪，当地人：思想有问题！

超六成前浪点赞《后浪》，全球白手起家90后富豪人均财富190亿

再不来一场精致野餐，我就要被开除中产籍了

工程师我只服中国，曾经放生到三峡的1万条鱼，如今怎么样了？

后疫情时代的五个营销启示

丘北县双龙营镇人民政府普者黑村委会、矣则村委会太阳能路灯采购安装项目竞争性谈判公告

为什么重量相同的金子，银行卖得比金店还便宜？看完涨知识了

打雷的时候，到底要不要拔掉插头，关闭电路呢？看完涨知识了

乘坐火车时，把车票弄丢了怎么处理？看完可算知道了

肖战视频专访：眼里带着故事，请不要听说他，这一次，请他说

秦山核电应急行动水平优化项目招标公告

巴基斯坦SK水电站消防及火灾报警系统设备采购招标招标公告

中煤能源新疆鸿新煤业苇子沟煤矿瓦斯抽采机械设备采购招标公告

县域社区团购，在平台发展上有哪些优势？

和王为念离婚，与“假奶奶”常香玉对簿公堂，55岁小香玉生活如诗

眼力测试：由4字组成的白菜，1秒看出4个字的智商都很高

看图猜字：这个不简单，你能猜对几个？全猜对眼力非凡

眼力测试：火焰中藏了4个字，看出3个算达标，全看出眼力200

小米硬刚德国双立人，400年非洲灌木做家用砧板，不发霉砍不坏

眼力测试：美女图中藏了5个汉字，全部看出来的眼力超群

最萌Hodler，刚出生就收到比特币大学教育基金的宝宝

《瞭望大湾区》：全国中高风险区域今日“清零”

《晨会解读》：中山证券投资顾问杨立华：连续上涨过后注意把握好操作节奏

孙松峰：幸福生活唱出来

衡水：守护一湖碧水 打造生态之城

英国小伙第一次体验中国网吧，就被电脑屏幕吓到直言：这是个啥

致敬平凡而伟大 #2020.04.04

清明 04-04 11:38

衡水：守护一湖碧水打造生态之城

2020珠峰高程复测出发仪式今日举行小米10全程助力丈量世界新高度