Teknologian jakaminen

sklearn perusopetusohjelma

2024-07-08

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina

Scikit-learn (sklearn) on suosittu koneoppimiskirjasto, joka tarjoaa monia työkaluja tiedon louhintaan ja tietojen analysointiin. Seuraavassa on yksinkertainen perusopetusohjelma sklearnista, joka esittelee tietojen esikäsittelyn, mallikoulutuksen ja arvioinnin.

1. Asennus ja tuonti

Varmista ensin, että sklearn-kirjasto on asennettu. Voidaan asentaa pip:llä:

 

pip install scikit-learn

Sklearnin tuonnissa käytetään yleensä seuraavaa menetelmää:

 

import sklearn from sklearn import datasets from sklearn.model_selection import train_test_split from sklearn.preprocessing import StandardScaler from sklearn.metrics import accuracy_score

2. Lataa tietojoukko

sklearn sisältää joitain sisäänrakennettuja vakiotietosarjoja, jotka helpottavat harjoitteluamme ja oppimistamme. Voimme esimerkiksi ladata iiristietojoukon:

 

iris = datasets.load_iris() X = iris.data # 特征数据 y = iris.target # 目标数据

3. Tietojen esikäsittely

Ennen mallin koulutusta tiedot on yleensä esikäsiteltävä, kuten standardointi, normalisointi, ominaisuuksien valinta jne.

normalisoituja tietoja

 

scaler = StandardScaler() X_scaled = scaler.fit_transform(X)

4. Jaa harjoitussarja ja testisarja

Jaa tietojoukko harjoitussarjaksi ja testisarjaksi, yleensä käyttämällä train_test_split toiminto:

 

X_train, X_test, y_train, y_test = train_test_split(X_scaled, y, test_size=0.3, random_state=42)

5. Valitse malli ja koulutus

Valitse koulutukseen sopiva malli, kuten tukivektorikone (SVM):

 

from sklearn.svm import SVC model = SVC(kernel='linear', C=1.0) model.fit(X_train, y_train)

6. Mallin arviointi

Käyttämällä testisarjaa mallin suorituskyvyn arvioimiseen voit käyttää indikaattoreita, kuten tarkkuutta:

 

y_pred = model.predict(X_test) accuracy = accuracy_score(y_test, y_pred) print(f'Accuracy: {accuracy}')

7. Parametrien viritys ja ristiinvalidointi

Käytä ristiinvalidointia mallin parametrien optimointiin:

 

from sklearn.model_selection import GridSearchCV parameters = {'kernel': ('linear', 'rbf'), 'C': [1, 10]} svc = SVC() clf = GridSearchCV(svc, parameters) clf.fit(X_train, y_train) print(clf.best_params_)

Tämä yksinkertainen opetusohjelma näyttää, kuinka sklearnia käytetään koneoppimisen perustehtäviin. sklearn tarjoaa runsaasti työkaluja ja algoritmeja, joita voidaan soveltaa erilaisten koneoppimisongelmien ratkaisemiseen. Tietty sovellus riippuu tiedoistasi ja erityisistä tehtävävaatimuksista. Voit tutkia tarkemmin sklearn-dokumentaatiota ja esimerkkejä perusteellista oppimista varten.