私の連絡先情報
郵便メール:
2024-07-12
한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina
デシジョン ツリー アルゴリズムは、分類および回帰タスクに使用できる、非常に人気のある機械学習アルゴリズムです。以下は、原則と実装例、および対応する Python コードを含む、ディシジョン ツリー アルゴリズムの詳細な紹介です。
デシジョン ツリーは、データの分類または回帰に使用されるツリー構造です。これはノードとエッジで構成され、各内部ノードは機能のテストを表し、各ブランチはテストの結果を表し、各リーフ ノードはカテゴリまたは回帰値を表します。
デシジョン ツリーの構築プロセスには通常、次の手順が含まれます。
以下は、Python と scikit-learn ライブラリを使用して実装された決定木分類のケースです。 3 つのアイリスの花 (セトーサ、バーシカラー、バージニカ) の特徴とカテゴリが含まれる有名なアイリス データセットを使用します。
- from sklearn.datasets import load_iris
- from sklearn.model_selection import train_test_split
-
- # 加载数据集
- iris = load_iris()
- X, y = iris.data, iris.target
-
- # 拆分数据集为训练集和测试集
- X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.3, random_state=42)
- from sklearn.tree import DecisionTreeClassifier
-
- # 初始化决策树分类器
- clf = DecisionTreeClassifier()
-
- # 训练模型
- clf.fit(X_train, y_train)
- from sklearn.metrics import accuracy_score
-
- # 预测测试集
- y_pred = clf.predict(X_test)
-
- # 计算准确率
- accuracy = accuracy_score(y_test, y_pred)
- print(f"Accuracy: {accuracy:.2f}")
- import matplotlib.pyplot as plt
- from sklearn.tree import plot_tree
-
- # 可视化决策树
- plt.figure(figsize=(12, 12))
- plot_tree(clf, filled=True, feature_names=iris.feature_names, class_names=iris.target_names)
- plt.show()
上記のコードは、scikit-learn ライブラリを使用して Iris データセットを読み込み、デシジョン ツリー分類器をトレーニングし、モデルのパフォーマンスを評価し、デシジョン ツリーを視覚化する方法を示しています。この事例を通じて、デシジョン ツリーがどのように機能するのか、そしてそれを実際のアプリケーションでどのように使用するのかを知ることができます。