Hello,大家好我叫是Dream呀,一个有趣的Python博主,小白一枚,多多关照 ?
入门须知:这片乐园从不缺乏天才,努力才是你的最终入场券!
最后,愿我们都能在看不到的地方闪闪发光,一起加油进步
“一万次悲伤,依然会有Dream,我一直在最温暖的地方等你”,唱的就是我!哈哈哈~
第十章:K最近邻算法
- 10.3.1
10.1橙子还是柚子
如何知道一个水果到底是柚子还是橙子呢?我知道,通常柚子比橙子更大、更红。
一般而言,柚子更大更红。这个水果又大又红,很可能是柚子。但是下面的这样的水果呢?
如何判断这个水果是柚子还是橙子?一种方法是看它的邻居。来看看离它最近的三个邻居。
在这三个邻居中,橙子比柚子多,因此这个水果很可能是橙子。祝贺你,你刚才是用的就是K最近邻(KNN)算法进行了分类!
KNN算法虽然简单但是却很有用!要对东西进行分类时,可首先尝试这种算法。例如:电影推荐系统。
10.2创建推荐系统
假如你要给用户创建一个电影推荐系统,从本质上来说,这类似于前面的水果问题!你可以将所有用户都放在一个图表中。
这些用户在图表中的位置取决于其喜好,因此喜好相近的用户距离较近。假如你想要给Alex推荐电影,可以找出五位与他最接近的用户。
假如在电影的喜好方面,Justin、JC、Joey、Lance和Chris都和Alex差不多,因此他们喜欢的电影,很可能Alex也很喜欢。
但是还有一个重要的问题,怎么确定他们之间的相似程度呢?
10.2.1
在前面的水果示例中,你根据个头和颜色来比较水果,换而言之,你比较的是个头和颜色。现在假设有三个水果,你可抽取它们的特征。
再根据这些特征绘图:
这样我们就可以来计算任意两种物品之间的直线距离。
10.2.2
假设你不仅要为Alex推荐电影,还要预测她将给这部电影打多少分。为此,先找出与她最近的五个人。
顺便说一句,我老说最近的五个人,其实并非一定要选择5个最近的邻居。这就是所说的K最近邻。
假如你要预测Alex给电影打多少分,你可以参考另外五个人的打分,对其求平均值,这就是回归!
你将使用KNN来做两项基本工作——分类和回归:
- 分类就是编组;
- 回归就是预测结果。
10.3机器学习简介
10.3.1
OCR指的是光学字符识别,这意味着你可拍摄印刷页面的照片,计算机将自动识别出其中的文字。
如何识别出这个数字是什么呢?可使用KNN。
- 浏览大量的数字图像,将这些数字的特征提取出来。
- 遇到新的图像时,你提取该图像的特征,再找出它最近的邻居都是谁!
与前面的水果实例相比,OCR中的特征提取要复杂得多,但再复杂的技术也是基于KNN等简单理念的。这些理念也可用于语音识别和人脸识别。你将照片上传到Facebook时,它有时候能够自动标出照片中的人物,这是机器学习在发挥作用!
OCR的第一步是查看大量的数字图像并提取特征,这被称为训练!大多数机器学习算法都包含训练的步骤:要让计算机完成任务,必须先训练它。
10.4小结
1.KNN用于分类和回归,需要考虑最近的邻居。
2.分类就是编组。
3.回归就是预测结果(如数字)。
4.特征抽取意味着将物品转换成一系列可以比较的数字。
5.能否挑选出合适的特征事关KNN算法的成败。
最后的福利
☀️☀️☀️最后一点小福利带给大家:如果想快速上手python的小伙伴们,这个详细整理PPT可以迅速帮助大家打牢python基础,需要的小伙伴们可以下载一下 Python入门基础教程全套+小白速成+学不会来找我!
还有自制表白神器,需要自取:
Python表白神器,源码+解析+各种完美配置+浪漫新颖
好啦,这就是今天要给大家分享的全部内容了
如果你喜欢的话,就不要吝惜你的一键三连了~
本文摘自 :https://blog.51cto.com/u