2024-07-12
한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina
L'algorithme d'arbre de décision est un algorithme d'apprentissage automatique très populaire qui peut être utilisé pour les tâches de classification et de régression. Ce qui suit est une introduction détaillée à l'algorithme de l'arbre de décision, y compris les principes et les implémentations de cas, ainsi que le code Python correspondant.
Un arbre de décision est une structure arborescente utilisée pour la classification ou la régression des données. Il se compose de nœuds et d'arêtes, où chaque nœud interne représente un test d'une fonctionnalité, chaque branche représente le résultat du test et chaque nœud feuille représente une catégorie ou une valeur de régression.
Le processus de construction d’un arbre de décision comprend généralement les étapes suivantes :
Ce qui suit est un cas de classification d'arbre de décision implémenté à l'aide de Python et de la bibliothèque scikit-learn. Nous utiliserons le célèbre jeu de données Iris, qui contient les caractéristiques et catégories de trois fleurs d'iris (Setosa, Versicolour, Virginica).
- from sklearn.datasets import load_iris
- from sklearn.model_selection import train_test_split
-
- # 加载数据集
- iris = load_iris()
- X, y = iris.data, iris.target
-
- # 拆分数据集为训练集和测试集
- X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.3, random_state=42)
- from sklearn.tree import DecisionTreeClassifier
-
- # 初始化决策树分类器
- clf = DecisionTreeClassifier()
-
- # 训练模型
- clf.fit(X_train, y_train)
- from sklearn.metrics import accuracy_score
-
- # 预测测试集
- y_pred = clf.predict(X_test)
-
- # 计算准确率
- accuracy = accuracy_score(y_test, y_pred)
- print(f"Accuracy: {accuracy:.2f}")
- import matplotlib.pyplot as plt
- from sklearn.tree import plot_tree
-
- # 可视化决策树
- plt.figure(figsize=(12, 12))
- plot_tree(clf, filled=True, feature_names=iris.feature_names, class_names=iris.target_names)
- plt.show()
Le code ci-dessus montre comment utiliser la bibliothèque scikit-learn pour charger l'ensemble de données Iris, former un classificateur d'arbre de décision, évaluer les performances du modèle et visualiser l'arbre de décision. A travers ce cas, vous pourrez voir comment fonctionne un arbre de décision et comment l'utiliser dans des applications pratiques.