DataScientistFoundation-PCA
[TOC]
本文内容框架与撰写思路如下:
开胃小菜
一只兔子帮你理解kNN 其中 以一只兔子作为故事主线,生动活泼,无需一行代码,装配精美的图示,kNN算法中的许多关键点跃然纸上;甚至,仅仅该文章的上来引用Jim Rohn的哲理,一下子就将kNN的精髓点透了。文章很赞,是值得学习的榜样。
直接上代码吧
sklearn.neighbors.KNeighborsClassifier Documentation
Parameters:
-
n_neighborskNN 模型的关键也几乎是唯一参数了; -
weights在计算距离时,对各个维度具有不同的权重设置; -
algorithmkNN虽然思路很简单,但是实现起来容易带来计算量的大问题,针对此分别有许多优化算法,比如kd树等; -
leaf_size,对kd树等算法的设置; -
metric究竟使用哪种距离计算公式; -
p距离计算的相关参数 p-norm -
metric_params返回一个dictionary -
n_jobs因为其中涉及大量的距离运算,实际上并不强调先后顺序,所以,可以使用并行运算
Methods
-
fit(X,y)作为有监督的分类模型,fit the model using X as training data and y as target values。 注意X的维度[n_samples, n_features],y的维度[n_samples, n_output] -
get_paramsGet parameters for this estimator无需赘述; -
kneighbors(sample=None, n_neighbors=None, return_distance=True)样本点sample到原训练样本矩阵X中最近n_neighbors个点,并返回到最近n_neighbors个样本点的距离,以及这些样本点在原样本矩阵中的索引index。