प्रौद्योगिकी साझेदारी

निर्णयवृक्षस्य एल्गोरिदम्, सिद्धान्ताः, प्रकरणकार्यन्वयनं च परिचयः

2024-07-12

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina

निर्णयवृक्षस्य एल्गोरिदम् अतीव लोकप्रियः यन्त्रशिक्षणस्य एल्गोरिदम् अस्ति यस्य उपयोगः वर्गीकरणस्य प्रतिगमनकार्यस्य च कृते कर्तुं शक्यते । निम्नलिखितम् निर्णयवृक्षस्य एल्गोरिदम् इत्यस्य विस्तृतपरिचयः अस्ति, यत्र सिद्धान्ताः, केस-कार्यन्वयनानि च सन्ति, तथैव तत्सम्बद्धः पायथन्-सङ्केतः अपि अस्ति ।

निर्णयवृक्षस्य एल्गोरिदमस्य परिचयः

मूलभूत अवधारणा

निर्णयवृक्षः दत्तांशस्य वर्गीकरणाय अथवा प्रतिगमनाय उपयुज्यमानः वृक्षसंरचना अस्ति । अस्मिन् नोड्स्, एज्स् च भवन्ति, यत्र प्रत्येकं आन्तरिकं नोड् कस्यचित् विशेषतायाः परीक्षणं प्रतिनिधियति, प्रत्येकं शाखा परीक्षणस्य परिणामं प्रतिनिधियति, प्रत्येकं पत्रनोड् च श्रेणीं वा प्रतिगमनमूल्यं वा प्रतिनिधियति

निर्माण प्रक्रिया

निर्णयवृक्षनिर्माणप्रक्रियायां प्रायः निम्नलिखितपदार्थाः समाविष्टाः भवन्ति ।

  1. उत्तमविशेषताः चिनुत: कस्यचित् मानदण्डस्य अनुसारं (यथा सूचनालाभः, गिनीसूचकाङ्कः इत्यादयः) दत्तांशसमूहस्य विभाजनार्थं उत्तमविशेषतानां चयनं कुर्वन्तु ।
  2. नोड् रचयन्तु: उत्तमविशेषतानां उपयोगेन दत्तांशसमूहं विभज्य प्रत्येकस्य शाखायाः कृते नूतनानि नोड् निर्मायताम् ।
  3. पुनरावर्तनीयरूपेण उपवृक्षाणां निर्माणं कुर्वन्तु: उत्तमविशेषतानां चयनं कृत्वा दत्तांशसमूहस्य विभाजनस्य प्रक्रिया प्रत्येकस्य बालनोड् कृते पुनरावृत्तिः भवति यावत् स्थगितशर्तः न पूर्यते (यथा नोड् शुद्धता निश्चितस्तरं प्राप्नोति अथवा वृक्षस्य गभीरता पूर्वनिर्धारितमूल्यं प्राप्नोति)
  4. पत्रग्रन्थिनिर्माणं कुर्वन्तु: पत्रनोड्स् तदा निर्मीयन्ते यदा विभाजनस्य आवश्यकता नास्ति, सामान्यतया वर्गीकरणवृक्षाणां बहुमतवर्गलेबलं, अथवा प्रतिगमनवृक्षाणां कृते उपसमूहे सर्वेषां दत्तांशबिन्दुनाम् औसतम्
विभक्त मानदण्ड
  • सूचनालाभः: कस्यचित् विशेषतायाः द्वारा दत्तांशसमूहस्य वर्गीकरणे अनिश्चिततायाः न्यूनीकरणं मापयति ।
  • गिनि अनुक्रमणिका: दत्तांशसमूहस्य शुद्धतां मापयति ।
  • न्यूनतमं माध्यवर्गदोषः (MSE) २.: प्रतिगमनवृक्षाणां कृते विभक्तः मानदण्डः।

प्रकरण कार्यान्वयन

निम्नलिखितम् एकः निर्णयवृक्षवर्गीकरणप्रकरणः अस्ति यः पायथन् तथा scikit-learn पुस्तकालयस्य उपयोगेन कार्यान्वितः अस्ति । वयं प्रसिद्धस्य Iris dataset इत्यस्य उपयोगं करिष्यामः, यस्मिन् त्रयाणां iris पुष्पाणां (Setosa, Versicolour, Virginica) विशेषताः श्रेणी च सन्ति ।

1. दत्तांशसज्जीकरणम्
  1. from sklearn.datasets import load_iris
  2. from sklearn.model_selection import train_test_split
  3. # 加载数据集
  4. iris = load_iris()
  5. X, y = iris.data, iris.target
  6. # 拆分数据集为训练集和测试集
  7. X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.3, random_state=42)
निर्णयवृक्षस्य प्रतिरूपं प्रशिक्षयन्तु
  1. from sklearn.tree import DecisionTreeClassifier
  2. # 初始化决策树分类器
  3. clf = DecisionTreeClassifier()
  4. # 训练模型
  5. clf.fit(X_train, y_train)
मूल्याङ्कनप्रतिरूपम्
  1. from sklearn.metrics import accuracy_score
  2. # 预测测试集
  3. y_pred = clf.predict(X_test)
  4. # 计算准确率
  5. accuracy = accuracy_score(y_test, y_pred)
  6. print(f"Accuracy: {accuracy:.2f}")
दृग्निर्णयवृक्षः
  1. import matplotlib.pyplot as plt
  2. from sklearn.tree import plot_tree
  3. # 可视化决策树
  4. plt.figure(figsize=(12, 12))
  5. plot_tree(clf, filled=True, feature_names=iris.feature_names, class_names=iris.target_names)
  6. plt.show()

सारांशः - १.

उपरिष्टाद् कोडः दर्शयति यत् Iris दत्तांशसमूहं लोड् कर्तुं, निर्णयवृक्षवर्गीकरणं प्रशिक्षितुं, मॉडल् कार्यप्रदर्शनस्य मूल्याङ्कनं कर्तुं, निर्णयवृक्षस्य दृश्यीकरणाय च scikit-learn पुस्तकालयस्य उपयोगः कथं करणीयः इति अस्य प्रकरणस्य माध्यमेन भवन्तः निर्णयवृक्षः कथं कार्यं करोति, व्यावहारिकप्रयोगेषु तस्य उपयोगः कथं भवति इति द्रष्टुं शक्नुवन्ति ।

आशासे यत् भवद्भ्यः सर्वेभ्यः रोचते यदि भवद्भ्यः इदं पसन्दं कृत्वा रक्षन्तु।