# 机器学习基本步骤 利用工具进行机器学习一般需要遵循固定流程,对于sklearn而言,基本流程如下: - 选择模型类: 选择需要的模型 - 选择模型超参数:对模型进行简单配置 - 用模型拟合训练数据:训练模型 - 用模型预测新数据的标签:预测结果 - 对模型进行评估-改进,循环到达到目标 ## 实例演示 我们用鸢尾花数据集对上面流程进行一个简单演示: ```python from sklearn.datasets import load_iris # 加载数据 iris = load_iris() X = iris.data y = iris.target #使用k临近分类器 #选择k临近模型 #这样的模型还有很多......也是我们学习的主要任务 from sklearn.neighbors import KNeighborsClassifier #配置超参数n_neighbors=1 model = KNeighborsClassifier(n_neighbors=1) #训练模型 model.fit(X, y) #利用训练好的模型预测结果 y_model = model.predict(X) #计算模型准确率 from sklearn.metrics import accuracy_score rst = accuracy_score(y, y_model) print("模型准确率:{}%".format(rst * 100)) ``` 模型准确率:100.0% 以上案例获取数据集,选择模型,进行训练并最终对结果进行了评估,当然最终结果是验证100%准确, 这虽然是个好数字,但对于我们的验证模型来说,一般不会也不应该出现完全正确的情况,可以这样理解,每次 考试都考100分的孩子,不正常呀!!!