# 实例化决策树API
clf = DecisionTreeClassifier()
# 训练模型
clf.fit(X_train , y_train)
# 用建立好的模型, 去查看在训练集上的分数
clf.score(X_train , y_train)
# 模型在测试数据集上面的准确率
clf.score(X_test , y_test)
# 查看模型建立后, 特征在建立模型中的重要请
clf.feature_importances_
import matplotlib.pyplot as plt
plt.style.use(\'seaborn\')
# 建立列表接收数据
# 接收测试集数据
score_test = []
# 接收训练集数据
score_train = []
# max_depth 是 1 - 10
for i in range(1,11):
# 建模
clf = DecisionTreeClassifier(max_depth= i , random_state=666 )
# 训练
clf.fit(X_train , y_train)
# 计算训练集分数
score_train.append(clf.score(X_train , y_train))
# 计算测试集分数
score_test.append(clf.score(X_test , y_test))
# 绘制训练集和测试集的分数变化曲线
plt.plot(range(1,11) , score_train , color= \'red\')
plt.plot(range(1,11) , score_test , color= \'green\')