yhteystietoni
Mailmesophia@protonmail.com
2024-07-12
한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina
Koneoppimisen maailmassa K-Nearest Neighbors (KNN) -algoritmi tunnetaan yksinkertaisuudestaan ja intuitiivisuudestaan. KNN on perusluokittelu- ja regressiomenetelmä, jonka toimintaperiaate on erittäin helppo ymmärtää: ennustaa, mihin luokkaan tai arvoon uusi datapiste kuuluu, mittaamalla erilaisten piirrearvojen välinen etäisyys. Scikit-learn (lyhyesti sklearn) Pythonissa laajalti käytetty koneoppimiskirjasto tarjoaa KNN-algoritmin toteutuksen. Tämä artikkeli esittelee yksityiskohtaisesti KNN-algoritmin käyttämisen sklearnissä ja tarjoaa käytännön koodiesimerkkejä.
K-lähimmän naapurin algoritmin ydinajatus on: jos suurin osa otoksen K lähimmästä naapurista piirreavaruudessa kuuluu johonkin tiettyyn kategoriaan, niin otos todennäköisesti kuuluu myös tähän kategoriaan.
Tässä ovat perusvaiheet KNN-luokitteluun sklearnilla:
from sklearn.neighbors import KNeighborsClassifier
Oletetaan, että sinulla on jo tietojoukkoX
on ominaismatriisi,y
on kohdemuuttuja.
from sklearn.datasets import load_iris
X, y = load_iris(return_X_y=True)
knn = KNeighborsClassifier(n_neighbors=3)
Käytä tietojoukkoa KNN-mallin kouluttamiseen.
knn.fit(X, y)
Käytä koulutettua mallia ennustamiseen.
y_pred = knn.predict(X)
KNN:ää voidaan käyttää myös regressiotehtäviin.
from sklearn.neighbors import KNeighborsRegressor
knn_reg = KNeighborsRegressor(n_neighbors=3)
Käytä tietojoukkoa KNN-regressiomallin kouluttamiseen.
knn_reg.fit(X, y)
Käytä harjoitettua mallia regression ennustamiseen.
y_pred_reg = knn_reg.predict(X)
K-lähimmän naapurin algoritmi on yksinkertainen mutta tehokas koneoppimismenetelmä, joka sopii luokitus- ja regressiotehtäviin. sklearn tarjoaa helppokäyttöisen KNN-toteutuksen, jonka avulla voimme nopeasti soveltaa tätä algoritmia käytännön ongelmiin.
Tässä artikkelissa kerrotaan, kuinka KNN-algoritmia käytetään sklearnissä, ja annetaan käytännön koodiesimerkkejä. Toivon, että tämä artikkeli auttaa lukijoita ymmärtämään paremmin K-lähimmän naapurin algoritmia ja hallitsemaan näiden tekniikoiden toteuttamismenetelmät sklearnissä. Datan määrän kasvaessa ja koneoppimisteknologian kehittyessä K-lähimmän naapurin algoritmilla on jatkossakin tärkeä rooli tiedon analysoinnissa ja ennakoivassa mallintamisessa.