2024-07-12
한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina
In der Welt des maschinellen Lernens ist der K-Nearest Neighbors (KNN)-Algorithmus für seine Einfachheit und Intuitivität bekannt. KNN ist eine grundlegende Klassifizierungs- und Regressionsmethode, und ihr Funktionsprinzip ist sehr leicht zu verstehen: Vorhersagen, zu welcher Kategorie oder zu welchem Wert ein neuer Datenpunkt gehört, indem der Abstand zwischen verschiedenen Merkmalswerten gemessen wird. Scikit-learn (kurz sklearn) stellt als weit verbreitete Bibliothek für maschinelles Lernen in Python die Implementierung des KNN-Algorithmus bereit. In diesem Artikel wird die Verwendung des KNN-Algorithmus in sklearn ausführlich vorgestellt und praktische Codebeispiele bereitgestellt.
Die Kernidee des K-Nearest-Neighbor-Algorithmus lautet: Wenn die meisten K nächsten Nachbarn einer Stichprobe im Merkmalsraum zu einer bestimmten Kategorie gehören, gehört die Stichprobe wahrscheinlich auch zu dieser Kategorie.
Hier sind die grundlegenden Schritte für die KNN-Klassifizierung mit sklearn:
from sklearn.neighbors import KNeighborsClassifier
Angenommen, Sie haben bereits einen Datensatz mitX
ist die charakteristische Matrix,y
ist die Zielvariable.
from sklearn.datasets import load_iris
X, y = load_iris(return_X_y=True)
knn = KNeighborsClassifier(n_neighbors=3)
Verwenden Sie den Datensatz, um das KNN-Modell zu trainieren.
knn.fit(X, y)
Verwenden Sie das trainierte Modell, um Vorhersagen zu treffen.
y_pred = knn.predict(X)
KNN kann auch für Regressionsaufgaben verwendet werden.
from sklearn.neighbors import KNeighborsRegressor
knn_reg = KNeighborsRegressor(n_neighbors=3)
Verwenden Sie den Datensatz, um ein KNN-Regressionsmodell zu trainieren.
knn_reg.fit(X, y)
Verwenden Sie das trainierte Modell für die Regressionsvorhersage.
y_pred_reg = knn_reg.predict(X)
Der K-Nearest-Neighbor-Algorithmus ist eine einfache, aber leistungsstarke Methode des maschinellen Lernens, die sich für Klassifizierungs- und Regressionsaufgaben eignet. sklearn bietet eine benutzerfreundliche KNN-Implementierung, die es uns ermöglicht, diesen Algorithmus schnell auf praktische Probleme anzuwenden.
Dieser Artikel beschreibt die Verwendung des KNN-Algorithmus in sklearn und bietet praktische Codebeispiele. Ich hoffe, dieser Artikel kann den Lesern helfen, den K-Nearest-Neighbor-Algorithmus besser zu verstehen und die Methoden zur Implementierung dieser Techniken in sklearn zu beherrschen. Da die Datenmenge weiter wächst und sich die Technologie des maschinellen Lernens weiterentwickelt, wird der K-Nearest-Neighbor-Algorithmus weiterhin eine wichtige Rolle bei der Datenanalyse und Vorhersagemodellierung spielen.