प्रौद्योगिकी साझेदारी

sklearn मूलभूत पाठ्यक्रम

2024-07-08

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina

Scikit-learn (sklearn) इति लोकप्रियं यन्त्रशिक्षणपुस्तकालयम् अस्ति यत् आँकडाखननस्य, आँकडाविश्लेषणस्य च कृते अनेकानि साधनानि प्रदाति । निम्नलिखितम् sklearn इत्यस्य सरलं मूलभूतं पाठ्यक्रमम् अस्ति, यस्मिन् data preprocessing, model training, evaluation च कथं कर्तव्यमिति परिचयः अस्ति ।

1. संस्थापनं आयातं च

प्रथमं भवतः sklearn पुस्तकालयः संस्थापितः अस्ति इति सुनिश्चितं कुर्वन्तु । pip इत्यस्य उपयोगेन स्थापनं कर्तुं शक्यते:

 

pip install scikit-learn

sklearn इत्यस्य आयाते प्रायः निम्नलिखितपद्धतिः उपयुज्यते ।

 

import sklearn from sklearn import datasets from sklearn.model_selection import train_test_split from sklearn.preprocessing import StandardScaler from sklearn.metrics import accuracy_score

2. दत्तांशसमूहं लोड् कुर्वन्तु

sklearn इत्यत्र अस्माकं अभ्यासस्य शिक्षणस्य च सुविधायै केचन अन्तःनिर्मिताः मानकदत्तांशसमूहाः सन्ति । यथा, वयं iris dataset लोड् कर्तुं शक्नुमः :

 

iris = datasets.load_iris() X = iris.data # 特征数据 y = iris.target # 目标数据

3. दत्तांशपूर्वसंसाधनम्

आदर्शस्य प्रशिक्षणात् पूर्वं प्रायः दत्तांशस्य पूर्वसंसाधनस्य आवश्यकता भवति, यथा मानकीकरणं, सामान्यीकरणं, विशेषताचयनम् इत्यादयः ।

सामान्यीकृतदत्तांशः

 

scaler = StandardScaler() X_scaled = scaler.fit_transform(X)

4. प्रशिक्षणसमूहं परीक्षणसमूहं च विभज्यताम्

दत्तांशसमूहं प्रशिक्षणसमूहे परीक्षणसमूहे च विभज्य, प्रायः उपयोगेन train_test_split नियोग:

 

X_train, X_test, y_train, y_test = train_test_split(X_scaled, y, test_size=0.3, random_state=42)

5. मॉडलं प्रशिक्षणं च चयनं कुर्वन्तु

प्रशिक्षणार्थं समुचितं प्रतिरूपं चिनुत, यथा समर्थनसदिशयन्त्रं (SVM):

 

from sklearn.svm import SVC model = SVC(kernel='linear', C=1.0) model.fit(X_train, y_train)

6. आदर्शमूल्यांकनम्

मॉडलस्य कार्यप्रदर्शनस्य मूल्याङ्कनार्थं परीक्षणसमूहस्य उपयोगेन भवान् सटीकता इत्यादीनां सूचकानां उपयोगं कर्तुं शक्नोति:

 

y_pred = model.predict(X_test) accuracy = accuracy_score(y_test, y_pred) print(f'Accuracy: {accuracy}')

7. पैरामीटर् ट्यूनिङ्ग् तथा क्रॉस्-वैलिडेशन

मॉडल-मापदण्डानां अनुकूलनार्थं क्रॉस्-वैलिडेशनस्य उपयोगं कुर्वन्तु:

 

from sklearn.model_selection import GridSearchCV parameters = {'kernel': ('linear', 'rbf'), 'C': [1, 10]} svc = SVC() clf = GridSearchCV(svc, parameters) clf.fit(X_train, y_train) print(clf.best_params_)

अस्मिन् सरलपाठ्यक्रमे मूलभूतयन्त्रशिक्षणकार्यस्य कृते sklearn इत्यस्य उपयोगः कथं भवति इति दर्शितम् अस्ति । sklearn इत्यनेन अनेकानि यन्त्रशिक्षणसमस्यानां समाधानार्थं प्रयोक्तुं शक्यन्ते इति साधनानां, एल्गोरिदम् इत्यस्य च धनं प्रदत्तम् । विशिष्टः अनुप्रयोगः भवतः दत्तांशस्य विशिष्टकार्यस्य आवश्यकतायाः च उपरि निर्भरं भवति यत् भवन्तः गहनशिक्षणार्थं sklearn दस्तावेजीकरणं उदाहरणानि च अधिकं अन्वेष्टुं शक्नुवन्ति ।