2024-07-12
한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina
Dans le monde de l'apprentissage automatique, l'algorithme K-Nearest Neighbours (KNN) est connu pour sa simplicité et son intuitivité. KNN est une méthode de classification et de régression de base, et son principe de fonctionnement est très simple à comprendre : prédire à quelle catégorie ou valeur appartient un nouveau point de données en mesurant la distance entre les différentes valeurs de caractéristiques. Scikit-learn (sklearn en abrégé), en tant que bibliothèque d'apprentissage automatique largement utilisée en Python, fournit l'implémentation de l'algorithme KNN. Cet article présentera en détail comment utiliser l'algorithme KNN dans sklearn et fournira des exemples de code pratiques.
L'idée centrale de l'algorithme des K-plus proches voisins est la suivante : si la plupart des K voisins les plus proches d'un échantillon dans l'espace des caractéristiques appartiennent à une certaine catégorie, alors l'échantillon est susceptible d'appartenir également à cette catégorie.
Voici les étapes de base de la classification KNN à l’aide de sklearn :
from sklearn.neighbors import KNeighborsClassifier
Supposons que vous disposiez déjà d'un ensemble de données avecX
est la matrice caractéristique,y
est la variable cible.
from sklearn.datasets import load_iris
X, y = load_iris(return_X_y=True)
knn = KNeighborsClassifier(n_neighbors=3)
Utilisez l'ensemble de données pour entraîner le modèle KNN.
knn.fit(X, y)
Utilisez le modèle entraîné pour faire des prédictions.
y_pred = knn.predict(X)
KNN peut également être utilisé pour des tâches de régression.
from sklearn.neighbors import KNeighborsRegressor
knn_reg = KNeighborsRegressor(n_neighbors=3)
Utilisez l'ensemble de données pour entraîner un modèle de régression KNN.
knn_reg.fit(X, y)
Utilisez le modèle entraîné pour la prédiction de régression.
y_pred_reg = knn_reg.predict(X)
L'algorithme K-plus proche voisin est une méthode d'apprentissage automatique simple mais puissante adaptée aux tâches de classification et de régression. sklearn fournit une implémentation KNN facile à utiliser, nous permettant d'appliquer rapidement cet algorithme à des problèmes pratiques.
Cet article explique comment utiliser l'algorithme KNN dans sklearn et fournit des exemples de code pratiques. J'espère que cet article pourra aider les lecteurs à mieux comprendre l'algorithme du K-voisin le plus proche et à maîtriser les méthodes de mise en œuvre de ces techniques dans sklearn. À mesure que la quantité de données continue de croître et que la technologie d’apprentissage automatique se développe, l’algorithme du K-plus proche voisin continuera à jouer un rôle important dans l’analyse des données et la modélisation prédictive.