le mie informazioni di contatto
Posta[email protected]
2024-07-08
한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina
Scikit-learn (sklearn) è una popolare libreria di machine learning che fornisce molti strumenti per il data mining e l'analisi dei dati. Quello che segue è un semplice tutorial di base su sklearn, che introduce come eseguire la preelaborazione dei dati, l'addestramento e la valutazione del modello.
Innanzitutto, assicurati di avere installata la libreria sklearn. Può essere installato utilizzando pip:
pip install scikit-learn
L'importazione di sklearn di solito utilizza il seguente metodo:
import sklearn from sklearn import datasets from sklearn.model_selection import train_test_split from sklearn.preprocessing import StandardScaler from sklearn.metrics import accuracy_score
sklearn contiene alcuni set di dati standard integrati per facilitare la nostra pratica e il nostro apprendimento. Ad esempio, possiamo caricare il set di dati dell'iride:
iris = datasets.load_iris() X = iris.data # 特征数据 y = iris.target # 目标数据
Prima di addestrare un modello, in genere i dati devono essere preelaborati, ad esempio standardizzazione, normalizzazione, selezione delle funzionalità, ecc.
dati normalizzati:
scaler = StandardScaler() X_scaled = scaler.fit_transform(X)
Dividere il set di dati in un set di training e un set di test, solitamente utilizzando train_test_split
funzione:
X_train, X_test, y_train, y_test = train_test_split(X_scaled, y, test_size=0.3, random_state=42)
Scegli un modello appropriato per la formazione, ad esempio una Support Vector Machine (SVM):
from sklearn.svm import SVC model = SVC(kernel='linear', C=1.0) model.fit(X_train, y_train)
Utilizzando il set di test per valutare le prestazioni del modello, è possibile utilizzare indicatori come l'accuratezza:
y_pred = model.predict(X_test) accuracy = accuracy_score(y_test, y_pred) print(f'Accuracy: {accuracy}')
Utilizza la convalida incrociata per ottimizzare i parametri del modello:
from sklearn.model_selection import GridSearchCV parameters = {'kernel': ('linear', 'rbf'), 'C': [1, 10]} svc = SVC() clf = GridSearchCV(svc, parameters) clf.fit(X_train, y_train) print(clf.best_params_)
Questo semplice tutorial mostra come utilizzare sklearn per attività di base di machine learning. Sklearn fornisce una vasta gamma di strumenti e algoritmi che possono essere applicati per risolvere vari problemi di apprendimento automatico. L'applicazione specifica dipende dai tuoi dati e dai requisiti dell'attività specifica. Puoi esplorare ulteriormente la documentazione e gli esempi di sklearn per un apprendimento approfondito.