前言:实践才能出真理,能动手就不要强迫,利用莺尾花数据集实战KNN算法。
1实战概述首先,介绍这次实战的总体思路。 要做什么,怎么办! 第一步,需要获得数据集并了解数据集信息。 数据集中总共包含三种类型的150条记录,每个类别有50条数据。 每张唱片有四个特征:花萼长度、花萼宽度、花瓣长度和花瓣宽度。 (莺尾花数据集已经是疯子,可以直接调用到sklearn库中)。 第二步,将数据集划分为训练集的测试集。 一般分割比率为8:2或7:3。 步骤构建并训练KNN算法模型(可以在sklearn中直接调用); 最后一步是评估模型(一般使用准确率)。
2代码实现froms klearn.neighborsimportkneighborsclassifier #导入模型froms klearn.datasetsimportload _ iris # 数据集froms klearn.model _ selectionimporttrain _ test _ splitfromsklearn.metricsimportaccuracy _ score #部署准确度评估类iris=数据特征y=iris.target #数据标签x_train、x_test、y_train、 y _ test=random _ state=666 ) #分割数据集KNN=kneighborsclassifier (n _ neighborsclassifier ),要创建train _ test _ split (x _ train ) y_train ) #模型训练y_pred=KNN.predict(x_test ) )预测测试集print('ACC_test: ',accuracy_score ) y