机器学习基础之常见距离计算

工人日报 2023-06-23 17:01:14

个人学习记录,若有侵权,请联系删除。 


(相关资料图)

一、欧氏距离(Euclidean Distance)

欧氏距离是最容易直观理解的度量方法。即两点之间的距离

如点

和点

之间的距离为:

缺点:欧氏距离并非尺度不变,这意味着所计算的距离可能会根据特征的单位发生倾斜。通常,在使用欧氏距离度量之前,需要对数据进行归一化处理。

二、标准化欧氏距离(Standard Euclidean Distance)

标准化欧氏距离是针对欧氏距离的缺点而作的一种改进,但要求必须基于一个数据集的分布

思路:既然数据各维分量的分布不一样,那先将各个分量都“标准化”到均值、方差相等,即使得各个维度分别满足标准正态分布。假设样本集X的均值为m,标准差为s,X的标准化变量表示为

如两个n维向量

间的标准化欧氏距离公式为:

三、曼哈顿距离(Manhattan Distance)

在曼哈顿街区要从一个十字路口开车到另一个十字路口,直观上看,绿线的距离最短,但在现实中显然是不成立的,因为我们不能穿过房屋。驾驶距离显然不是两点间的直线距离,这些实际驾驶距离就是“曼哈顿距离”,也称为“街区距离”

红蓝黄线均为曼哈顿距离,绿线为欧氏距离

如两个n维向量

间的曼哈顿距离公式为:

四、切比雪夫距离(Chebyshev Distance)

切比雪夫距离来源于国际象棋,国王可以直行、横行、斜行,所以国王走一步可以移动到相邻8个方格中的任意一个。国王从一个格子走到另一个格子最少需要多少步?这个距离就是切比雪夫距离如两个n维向量

间的切比雪夫距离公式为:

五、闵可夫斯基距离(Minkowski Distance)

1、闵可距离的定义

两个n维向量

间的闵可夫斯基距离公式为:

其中p是一个变参数

当p=1时,就是曼哈顿距离

当p=2时,就是欧氏距离

当p=无穷时,就是切比雪夫距离

2、闵可距离的缺点

1)将各个分量的量纲,也就是“单位”当作相同的看待了

2)没有考虑各个分量的分布(期望,方差等)可能是不同的

x

资讯

从“美丽”向“美好”嬗变——嘉泽镇晨山村的乡村振兴之路

2022-06

海南推动农贸市场全面落实禁塑 加强违禁塑料制品源头治理

2021-12

柴犬登登拍卖记:动物是如何被司法拍卖的

2021-12

江西:到2025年鄱阳湖区断面水质优良比例达到50%以上

2021-12

西藏森林消防:锻造雪域救援尖兵 打造高海拔山岳救援队伍

2021-12

加强人才融通发展 第10届海峡两岸水利青年工程交流营成功举办

2021-12

四川:空手夺刀救人的“95后”女民警捐献万元奖金传递爱心

2021-12

中国食品名市临沂坚持“三化融合” 争做“食安”守望者

2021-12

上海闵行一幼儿园教职工殴打幼儿 2名涉事人员已被行拘

2021-12

受贿1414万元 江西万载县委原书记胡全顺获刑11年6个月

2021-12

动态

机器学习基础之常见距离计算

2023-06

新开横版传奇手游推荐 十大热门横版传奇手游排行榜 环球热讯

2023-06

环球快资讯丨湖南嘉德投资置业有限公司

2023-06

49日剧情介绍 49日剧情介绍内容 世界热门

2023-06

神武手游化生攻略_神武手游化生真正需要什么|今日讯

2023-06

热点在线丨梦幻工具(梦幻西游工具箱模拟器)

2023-06

天天通讯!咚咚锵,叮叮当,嘿嘿哈……端午假期,根本玩不过来

2023-06

八仙筒到通辽客车时刻表_八仙筒-热讯

2023-06

总投资约2.7亿元!这个项目,正式开工!_天天热头条

2023-06

全球今热点:《星空》没有陆地载具 不支持钓鱼

2023-06