2024-07-08
한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina
Scikit-learn (sklearn) on suosittu koneoppimiskirjasto, joka tarjoaa monia työkaluja tiedon louhintaan ja tietojen analysointiin. Seuraavassa on yksinkertainen perusopetusohjelma sklearnista, joka esittelee tietojen esikäsittelyn, mallikoulutuksen ja arvioinnin.
Varmista ensin, että sklearn-kirjasto on asennettu. Voidaan asentaa pip:llä:
pip install scikit-learn
Sklearnin tuonnissa käytetään yleensä seuraavaa menetelmää:
import sklearn from sklearn import datasets from sklearn.model_selection import train_test_split from sklearn.preprocessing import StandardScaler from sklearn.metrics import accuracy_score
sklearn sisältää joitain sisäänrakennettuja vakiotietosarjoja, jotka helpottavat harjoitteluamme ja oppimistamme. Voimme esimerkiksi ladata iiristietojoukon:
iris = datasets.load_iris() X = iris.data # 特征数据 y = iris.target # 目标数据
Ennen mallin koulutusta tiedot on yleensä esikäsiteltävä, kuten standardointi, normalisointi, ominaisuuksien valinta jne.
normalisoituja tietoja:
scaler = StandardScaler() X_scaled = scaler.fit_transform(X)
Jaa tietojoukko harjoitussarjaksi ja testisarjaksi, yleensä käyttämällä train_test_split
toiminto:
X_train, X_test, y_train, y_test = train_test_split(X_scaled, y, test_size=0.3, random_state=42)
Valitse koulutukseen sopiva malli, kuten tukivektorikone (SVM):
from sklearn.svm import SVC model = SVC(kernel='linear', C=1.0) model.fit(X_train, y_train)
Käyttämällä testisarjaa mallin suorituskyvyn arvioimiseen voit käyttää indikaattoreita, kuten tarkkuutta:
y_pred = model.predict(X_test) accuracy = accuracy_score(y_test, y_pred) print(f'Accuracy: {accuracy}')
Käytä ristiinvalidointia mallin parametrien optimointiin:
from sklearn.model_selection import GridSearchCV parameters = {'kernel': ('linear', 'rbf'), 'C': [1, 10]} svc = SVC() clf = GridSearchCV(svc, parameters) clf.fit(X_train, y_train) print(clf.best_params_)
Tämä yksinkertainen opetusohjelma näyttää, kuinka sklearnia käytetään koneoppimisen perustehtäviin. sklearn tarjoaa runsaasti työkaluja ja algoritmeja, joita voidaan soveltaa erilaisten koneoppimisongelmien ratkaisemiseen. Tietty sovellus riippuu tiedoistasi ja erityisistä tehtävävaatimuksista. Voit tutkia tarkemmin sklearn-dokumentaatiota ja esimerkkejä perusteellista oppimista varten.