Guide d'apprentissage de l'IA Apprentissage automatique - Formation et prédiction du modèle de clustering K-means

2024-07-12

Guide d'apprentissage de l'IA Apprentissage automatique - Formation et prédiction du modèle de clustering K-means

L’intelligence artificielle (IA) est aujourd’hui l’un des sujets les plus brûlants dans le monde et elle change notre façon de vivre et de travailler. En tant que branche importante de l’IA, l’apprentissage automatique a montré un grand potentiel et une grande valeur dans divers domaines. En apprentissage automatique, le clustering est un algorithme important, et le clustering K-means est l'une des méthodes classiques. Dans ce blog, nous présenterons en détail le processus de formation et le processus de prédiction du modèle de clustering K-means, et fournirons des exemples pour illustrer comment utiliser le clustering K-means pour effectuer une analyse de cluster sur les données.

Modèle de clustering K-means

Le clustering K-means est un algorithme d'apprentissage non supervisé qui divise les échantillons de l'ensemble de données en K clusters pour rendre la distance entre les échantillons d'un même cluster aussi petite que possible et la distance entre les différents clusters aussi grande que possible. Dans le clustering K-means, chaque cluster est représenté par un centroïde et le clustering est effectué de manière itérative en minimisant la distance entre les échantillons du cluster et le centroïde.

Le processus de clustering K-means peut être grossièrement divisé en les étapes suivantes :

Sélectionnez K points centraux initiaux
Attribuez chaque échantillon au cluster avec le point central le plus proche
Mettre à jour le centre de gravité de chaque cluster
Répétez les étapes 2 et 3 jusqu'à ce que l'allocation des clusters ne change plus ou que la limite supérieure du nombre d'itérations soit atteinte.

Le processus de prédiction du modèle de clustering K-means consiste à attribuer de nouveaux échantillons au cluster ayant le centroïde le plus proche.

Processus de formation du modèle de clustering K-means

Dans cette partie, nous présenterons en détail le processus de formation du modèle de clustering K-means. Pour faciliter l'explication, nous utiliserons la bibliothèque scikit-learn de Python pour la démonstration.

Tout d’abord, nous devons importer les bibliothèques pertinentes :

import numpy as np
import matplotlib.pyplot as plt
from sklearn.datasets import make_blobs
from sklearn.cluster import KMeans
1
2
3
4

Ensuite, nous générons des données simulées pour démontrer :

X, y = make_blobs(n_samples=300, centers=4, cluster_std=0.60, random_state=0)
1

Nous pouvons ensuite utiliser le modèle de clustering K-means pour nous entraîner sur les données :

kmeans = KMeans(n_clusters=4)
kmeans.fit(X)
1
2

Enfin, nous pouvons visualiser les résultats de la formation, ainsi que les centroïdes des clusters :

plt.scatter(X[:, 0], X[:, 1], s=50, c="lightblue", marker="o", edgecolor="black")
plt.scatter(kmeans.cluster_centers_[:, 0], kmeans.cluster_centers_[:, 1], s=250, marker="*", c="red", edgecolor="black")
plt.show()
1
2
3

Grâce aux étapes ci-dessus, nous avons terminé le processus de formation du modèle de clustering K-means et avons également obtenu une image visuelle des résultats de la formation.

Processus de prédiction du modèle de clustering K-means

Introduisons ensuite le processus de prédiction du modèle de clustering K-means. Dans le modèle de clustering K-means, le processus de prédiction consiste à attribuer de nouveaux échantillons au cluster ayant le centroïde le plus proche.

Premièrement, nous pouvons utiliser le modèle de clustering K-means entraîné pour prédire de nouveaux échantillons :

new_samples = np.array([[0, 0], [4, 4]])
predicted_labels = kmeans.predict(new_samples)
print(predicted_labels)
1
2
3

Dans le code ci-dessus, nous créons deux nouveaux exemples[0, 0]et[4, 4], et utilisepredict méthode pour le prédire. Enfin, nous obtenons les étiquettes de cluster prédites pour les nouveaux échantillons.

Exemple

Afin de comprendre plus intuitivement le processus de formation et de prédiction du modèle de clustering K-means, nous l'illustrerons avec un exemple spécifique.

Supposons que nous ayons un ensemble de données avec trois fonctionnalitésX , nous voulons le diviser en 3 clusters. Tout d'abord, nous pouvons entraîner les données à l'aide d'un modèle de clustering K-means :

kmeans = KMeans(n_clusters=3)
kmeans.fit(X)
1
2

Ensuite, nous appliquons le modèle entraîné à de nouveaux échantillons :

new_samples = np.array([[1, 1, 1], [2, 2, 2]])
predicted_labels = kmeans.predict(new_samples)
print(predicted_labels)
1
2
3

Grâce aux exemples ci-dessus, nous pouvons clairement voir le processus de formation et de prédiction du modèle de clustering K-means.

Résumer

Grâce à l'introduction de ce blog, nous avons une compréhension détaillée du processus de formation et du processus de prédiction du modèle de clustering K-means, et démontrons à travers des exemples comment utiliser la bibliothèque scikit-learn de Python pour effectuer un clustering K-means. Le clustering K-means est un algorithme de clustering simple et efficace qui peut être appliqué à divers domaines, notamment l'analyse de données, le traitement d'images, etc. J'espère que ce blog vous aidera à apprendre l'apprentissage automatique et l'intelligence artificielle !

Partage de technologie