informasi kontak saya
Surat[email protected]
2024-07-12
한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina
Algoritma pohon keputusan adalah algoritma pembelajaran mesin yang sangat populer yang dapat digunakan untuk tugas klasifikasi dan regresi. Berikut ini adalah pengenalan mendetail tentang algoritma pohon keputusan, termasuk prinsip dan implementasi kasus, serta kode Python yang sesuai.
Pohon keputusan adalah struktur pohon yang digunakan untuk klasifikasi atau regresi data. Ini terdiri dari node dan edge, di mana setiap node internal mewakili pengujian suatu fitur, setiap cabang mewakili hasil pengujian, dan setiap node daun mewakili kategori atau nilai regresi.
Proses konstruksi pohon keputusan biasanya mencakup langkah-langkah berikut:
Berikut ini adalah kasus klasifikasi pohon keputusan yang diimplementasikan menggunakan Python dan perpustakaan scikit-learn. Kami akan menggunakan kumpulan data Iris yang terkenal, yang berisi fitur dan kategori tiga bunga iris (Setosa, Versicolour, Virginica).
- from sklearn.datasets import load_iris
- from sklearn.model_selection import train_test_split
-
- # 加载数据集
- iris = load_iris()
- X, y = iris.data, iris.target
-
- # 拆分数据集为训练集和测试集
- X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.3, random_state=42)
- from sklearn.tree import DecisionTreeClassifier
-
- # 初始化决策树分类器
- clf = DecisionTreeClassifier()
-
- # 训练模型
- clf.fit(X_train, y_train)
- from sklearn.metrics import accuracy_score
-
- # 预测测试集
- y_pred = clf.predict(X_test)
-
- # 计算准确率
- accuracy = accuracy_score(y_test, y_pred)
- print(f"Accuracy: {accuracy:.2f}")
- import matplotlib.pyplot as plt
- from sklearn.tree import plot_tree
-
- # 可视化决策树
- plt.figure(figsize=(12, 12))
- plot_tree(clf, filled=True, feature_names=iris.feature_names, class_names=iris.target_names)
- plt.show()
Kode di atas menunjukkan cara menggunakan perpustakaan scikit-learn untuk memuat kumpulan data Iris, melatih pengklasifikasi pohon keputusan, mengevaluasi kinerja model, dan memvisualisasikan pohon keputusan. Melalui kasus ini, Anda dapat melihat cara kerja pohon keputusan dan cara menggunakannya dalam aplikasi praktis.