2021年1月28日晚9时,山东大学土建与水利学院“科研我当先”实践团队线上进行第三次内容分享。会议由龚陈博同学主持,全体成员参加。
本次交流由龚陈博同学主讲,他关于机器学习中的KNN算法进行了深入浅出的分享。
K近邻法(k-nearest neighbor,KNN)是一种基本的机器学习方法,在我们平常的生活中也会不自主的应用,就是“物以类聚,人以群分”。比如,我们判断一个人的人品,只需要观察他来往最密切的几个人的人品好坏就可以得出了。这里就是运用了KNN的思想。KNN方法既可以做分类,也可以做回归,这和决策树算法相同。

KNN做回归和分类的主要区别在于最后做预测时候的决策方式不同。KNN做分类预测时,一般是选择多数表决法,即训练集里和预测的样本特征最近的K个样本,预测为里面有最多类别数的类别。而KNN做回归时,一般是选择平均法,即最近的K个样本的样本输出的平均值作为回归预测值。
此外龚陈博同学说明了KNN算法的三个要素:
1. K值的选取
2. 距离的度量
3. 分类决策规则
并且用C++提供了一个样例的相关代码进行测试:

最后,龚陈博同学讲了KNN算法的一些缺陷:
1、效率低,因为每一次分类或者回归,都要把训练数据和测试数据都算一遍,如果数据量很大的话,需要的算力会很惊人,但是在机器学习中,大数据处理又是很常见的一件事。
2、对训练数据依赖度特别大,虽然所有机器学习的算法对数据的依赖度很高,但是KNN尤其严重,因为如果训练数据集中,有一两个数据是错误的,刚刚好又在需要分类的数值的旁边,这样就会直接导致预测的数据的不准确,对训练数据的容错性太差
3、维数灾难,KNN对于多维度的数据处理也不是很好。
通过此次龚陈博同学的分享,团队成员了解了机器学习中KNN算法的相关知识,拓展了知识。本次会议分享持续了三十分种,对于非本专业的学生是一次很好的学习机会。
http://www.dxsbao.com/shijian/337541.html
点此复制本页地址
郑州地处中国地理中心,是全国重要的铁路、航空、高速公路、电力、邮政电信主枢纽城市,中国中部地区重要的工业城市。目前有汽车、装备制造、煤电铝、食品、纺织服装、电子信息等六大优……
王善治 华北水利水电大学查看全文 >>
7 18日,我们社会实践队伍的全体成员收拾好行李,在下午乘车来到了郑州开始我们本次的社会实践,离开之前我们在学校的正门口进行了拍照留影。晚上当我们到达郑州后,在晚上召开我们本次活……
王善治 华北水利水电大学查看全文 >>
7月18日这一天,致敬新时代实践队早早地起来收拾行装,正式开始我们的社会实践活动, 我们提前买好了火车票,大家拿上行礼赶往火车站,在火车站清点好人数后,一起上火车前往郑州,到达郑……
查看全文 >>
今天是我们暑期社会实践的第七天,我们本次活动的任务是去宋陵公园做问卷调查,当我们进入巩义宋陵公园的时候,公园里的市民都在进行悠闲地聊天活动,他们大多都忙于玩,很多都拒绝了我……
王善治 华北水利水电大学查看全文 >>
致敬新时代华水暑期社会实践队的第七天,我们来到了巩义市,对对巩义市的各个城区进行问卷调查。人民们的感受和生活的改变 ,更能体现出十三五对我们生活的影响,所以我们首先调研商业区……
王善治 华北水利水电大学查看全文 >>
试问哪里能找到一批悠闲了老大爷,答曰:公园。虽然现在经常看见一些关于老年人的负面新闻,但不可否认,他们都曾为祖国的建设出过一份力,或许,他们对现如今祖国的改变有着更深刻的认……
王善治 华北水利水电大学查看全文 >>
我们说到环卫工人就能联想到身穿一件火红的黄色马甲,左手拿扫把右手拿簸箕的形象。无论是严寒酷暑,一年四季如果你留意的话,每次在马路边、街道上都能看到他们的身影,就因为有了这些……
王善治 华北水利水电大学查看全文 >>
7月15日,我们开始了今天的社会实践活动,今天我们的任务是去做社区服务。这一天,我通过自己的努力奋斗,体会到了工作中的酸甜苦辣,这时才发现自己是最幸福的。因为我还在学习的阶段,……
王善治 华北水利水电大学查看全文 >>