# 机器学习基本步骤

利用工具进行机器学习一般需要遵循固定流程，对于sklearn而言，基本流程如下：

- 选择模型类: 选择需要的模型
- 选择模型超参数：对模型进行简单配置
- 用模型拟合训练数据：训练模型
- 用模型预测新数据的标签：预测结果
- 对模型进行评估-改进，循环到达到目标

## 实例演示 

我们用鸢尾花数据集对上面流程进行一个简单演示：

```python

from sklearn.datasets import load_iris

# 加载数据
iris = load_iris()

X = iris.data
y = iris.target

#使用ｋ临近分类器
#选择k临近模型
#这样的模型还有很多......也是我们学习的主要任务
from sklearn.neighbors import KNeighborsClassifier

#配置超参数n_neighbors=1
model  = KNeighborsClassifier(n_neighbors=1)

#训练模型
model.fit(X, y)

#利用训练好的模型预测结果
y_model = model.predict(X)

#计算模型准确率
from sklearn.metrics import accuracy_score
rst = accuracy_score(y, y_model)

print("模型准确率：{}％".format(rst * 100))
```

    模型准确率：100.0％
    

以上案例获取数据集，选择模型，进行训练并最终对结果进行了评估，当然最终结果是验证100%准确，
这虽然是个好数字，但对于我们的验证模型来说，一般不会也不应该出现完全正确的情况，可以这样理解，每次
考试都考100分的孩子，不正常呀！！！