-
ユークリッド距離 (Euclidean)
最も基本的な直線距離。
🔗 scipy.spatial.distance.euclidean -
マンハッタン距離 (Manhattan / Cityblock)
縦横移動の総和(碁盤の目)。
🔗 scipy.spatial.distance.cityblock -
チェビシェフ距離 (Chebyshev)
最大の軸方向差を距離とする。
🔗 scipy.spatial.distance.chebyshev -
ミンコフスキー距離 (Minkowski)
p次元の一般化距離(p=1でマンハッタン、p=2でユークリッド)。
🔗 scipy.spatial.distance.minkowski -
カンベラ距離 (Canberra)
正規化された差で小さな差に敏感。
🔗 scipy.spatial.distance.canberra -
コサイン類似度 (Cosine)
ベクトル間の角度の類似度。文書解析で定番。
🔗 sklearn.metrics.pairwise.cosine_similarity -
ピアソン相関 (Pearson correlation)
線形相関の強さを測る。
🔗 numpy.corrcoef -
スピアマン相関 (Spearman correlation)
順位に基づく相関を測る。
🔗 scipy.stats.spearmanr -
マハラノビス距離 (Mahalanobis)
共分散を考慮した距離。外れ値検出に強い。
🔗 scipy.spatial.distance.mahalanobis -
標準化ユークリッド距離 (Standardized Euclidean)
変数ごとの分散でスケーリングした距離。
🔗 scipy.spatial.distance.seuclidean -
カイ二乗距離 (Chi-square distance)
分布・ヒストグラム比較で使用。
🔗 Chi-square distance example (StackOverflow) -
ジェンセン–シャノン距離 (Jensen–Shannon)
KL距離を対称化した分布比較。
🔗 scipy.spatial.distance.jensenshannon -
レーベンシュタイン距離 (Levenshtein / Edit distance)
文字列の挿入・削除・置換回数。
🔗 python-Levenshtein GitHub -
ハミング距離 (Hamming)
ビットや文字列の異なる位置数を数える。
🔗 scipy.spatial.distance.hamming -
ジャッカード係数 (Jaccard index)
集合の共通部分/和集合の比率。
🔗 sklearn.metrics.jaccard_score -
ダイス係数 (Dice / Sørensen–Dice)
共通部分を2倍強調する集合類似度。
🔗 Dice coefficient example (scikit-learn discussion)
(Diceは直接関数なし。Jaccardを応用可)