Οδηγός AI Learning Machine Learning - K-means Clustering Model Training and Prediction

Οδηγός AI Learning Machine Learning - K-means Εκπαίδευση και Πρόβλεψη Μοντέλων Ομαδοποίησης

2024-07-12

Οδηγός AI Learning Machine Learning - K-means Εκπαίδευση και Πρόβλεψη Μοντέλων Ομαδοποίησης

Η τεχνητή νοημοσύνη (AI) είναι ένα από τα πιο καυτά θέματα στον κόσμο σήμερα και αλλάζει τον τρόπο που ζούμε και εργαζόμαστε. Ως σημαντικός κλάδος της τεχνητής νοημοσύνης, η μηχανική μάθηση έχει δείξει μεγάλες δυνατότητες και αξία σε διάφορους τομείς. Στη μηχανική μάθηση, η ομαδοποίηση είναι ένας σημαντικός αλγόριθμος και η ομαδοποίηση K-means είναι μια από τις κλασικές μεθόδους. Σε αυτό το ιστολόγιο, θα εισαγάγουμε λεπτομερώς τη διαδικασία εκπαίδευσης και τη διαδικασία πρόβλεψης του μοντέλου ομαδοποίησης K-means και θα παρέχουμε παραδείγματα για να επεξηγήσουμε τον τρόπο χρήσης της ομαδοποίησης K-means για την εκτέλεση ανάλυσης ομαδοποίησης δεδομένων.

K-means μοντέλο ομαδοποίησης

Η ομαδοποίηση K-means είναι ένας αλγόριθμος μάθησης χωρίς επίβλεψη που διαιρεί τα δείγματα στο σύνολο δεδομένων σε ομάδες K για να κάνει την απόσταση μεταξύ των δειγμάτων στο ίδιο σύμπλεγμα όσο το δυνατόν μικρότερη και την απόσταση μεταξύ διαφορετικών συστάδων όσο το δυνατόν μεγαλύτερη. Στην ομαδοποίηση K-means, κάθε συστάδα αντιπροσωπεύεται από ένα κέντρο και η ομαδοποίηση εκτελείται επαναληπτικά ελαχιστοποιώντας την απόσταση μεταξύ των δειγμάτων στη συστάδα και στο κέντρο.

Η διαδικασία της ομαδοποίησης K-means μπορεί να χωριστεί χονδρικά στα ακόλουθα βήματα:

Επιλέξτε K αρχικά κεντρικά σημεία
Αντιστοιχίστε κάθε δείγμα στο σύμπλεγμα με το πλησιέστερο κεντρικό σημείο
Ενημερώστε το κέντρο κάθε συμπλέγματος
Επαναλάβετε τα βήματα 2 και 3 μέχρι να μην αλλάξει πλέον η κατανομή των συμπλεγμάτων ή να συμπληρωθεί το ανώτατο όριο του αριθμού των επαναλήψεων.

Η διαδικασία πρόβλεψης του μοντέλου ομαδοποίησης K-means είναι η ανάθεση νέων δειγμάτων στο σύμπλεγμα με το πλησιέστερο κέντρο.

Διαδικασία εκπαίδευσης του μοντέλου ομαδοποίησης K-means

Σε αυτό το μέρος, θα παρουσιάσουμε αναλυτικά τη διαδικασία εκπαίδευσης του μοντέλου ομαδοποίησης K-means. Για ευκολία στην εξήγηση, θα χρησιμοποιήσουμε τη βιβλιοθήκη scikit-learn της Python για επίδειξη.

Αρχικά, πρέπει να εισαγάγουμε τις σχετικές βιβλιοθήκες:

import numpy as np
import matplotlib.pyplot as plt
from sklearn.datasets import make_blobs
from sklearn.cluster import KMeans
1
2
3
4

Στη συνέχεια, δημιουργούμε κάποια προσομοιωμένα δεδομένα για να δείξουμε:

X, y = make_blobs(n_samples=300, centers=4, cluster_std=0.60, random_state=0)
1

Μπορούμε στη συνέχεια να χρησιμοποιήσουμε το μοντέλο ομαδοποίησης K-means για εκπαίδευση στα δεδομένα:

kmeans = KMeans(n_clusters=4)
kmeans.fit(X)
1
2

Τέλος, μπορούμε να οπτικοποιήσουμε τα αποτελέσματα της προπόνησης, καθώς και τα κεντροειδή των συστάδων:

plt.scatter(X[:, 0], X[:, 1], s=50, c="lightblue", marker="o", edgecolor="black")
plt.scatter(kmeans.cluster_centers_[:, 0], kmeans.cluster_centers_[:, 1], s=250, marker="*", c="red", edgecolor="black")
plt.show()
1
2
3

Μέσα από τα παραπάνω βήματα, ολοκληρώσαμε τη διαδικασία εκπαίδευσης του μοντέλου ομαδοποίησης K-means και αποκτήσαμε επίσης μια οπτική εικόνα των αποτελεσμάτων της εκπαίδευσης.

Διαδικασία πρόβλεψης του μοντέλου ομαδοποίησης K-means

Στη συνέχεια, ας εισαγάγουμε τη διαδικασία πρόβλεψης του μοντέλου ομαδοποίησης K-means. Στο μοντέλο ομαδοποίησης K-means, η διαδικασία πρόβλεψης είναι να εκχωρηθούν νέα δείγματα στο σύμπλεγμα με το πλησιέστερο κέντρο.

Πρώτον, μπορούμε να χρησιμοποιήσουμε το εκπαιδευμένο μοντέλο ομαδοποίησης K-means για να προβλέψουμε νέα δείγματα:

new_samples = np.array([[0, 0], [4, 4]])
predicted_labels = kmeans.predict(new_samples)
print(predicted_labels)
1
2
3

Στον παραπάνω κώδικα, δημιουργούμε δύο νέα δείγματα[0, 0]και[4, 4], και χρήσηpredict μέθοδος πρόβλεψης. Τέλος, παίρνουμε τις προβλεπόμενες ετικέτες συμπλέγματος για νέα δείγματα.

Παράδειγμα

Για να κατανοήσουμε τη διαδικασία εκπαίδευσης και πρόβλεψης του μοντέλου ομαδοποίησης K-means πιο διαισθητικά, θα το επεξηγήσουμε με ένα συγκεκριμένο παράδειγμα.

Ας υποθέσουμε ότι έχουμε ένα σύνολο δεδομένων με τρία χαρακτηριστικάX , θέλουμε να το χωρίσουμε σε 3 συμπλέγματα. Αρχικά, μπορούμε να εκπαιδεύσουμε τα δεδομένα χρησιμοποιώντας ένα μοντέλο ομαδοποίησης K-means:

kmeans = KMeans(n_clusters=3)
kmeans.fit(X)
1
2

Στη συνέχεια, εφαρμόζουμε το εκπαιδευμένο μοντέλο σε νέα δείγματα:

new_samples = np.array([[1, 1, 1], [2, 2, 2]])
predicted_labels = kmeans.predict(new_samples)
print(predicted_labels)
1
2
3

Μέσα από τα παραπάνω παραδείγματα, μπορούμε να δούμε ξεκάθαρα τη διαδικασία εκπαίδευσης και πρόβλεψης του μοντέλου ομαδοποίησης K-means.

Συνοψίζω

Μέσα από την εισαγωγή αυτού του ιστολογίου, έχουμε μια λεπτομερή κατανόηση της διαδικασίας εκπαίδευσης και της διαδικασίας πρόβλεψης του μοντέλου ομαδοποίησης K-means και δείχνουμε μέσω παραδειγμάτων πώς να χρησιμοποιήσετε τη βιβλιοθήκη scikit-learn της Python για την εκτέλεση ομαδοποίησης K-means. Η ομαδοποίηση K-means είναι ένας απλός και αποτελεσματικός αλγόριθμος ομαδοποίησης που μπορεί να εφαρμοστεί σε διάφορα πεδία, συμπεριλαμβανομένης της ανάλυσης δεδομένων, της επεξεργασίας εικόνας κ.λπ. Ελπίζω αυτό το ιστολόγιο να σας βοηθήσει να μάθετε μηχανική μάθηση και τεχνητή νοημοσύνη!

Κοινή χρήση τεχνολογίας

Οδηγός AI Learning Machine Learning - K-means Εκπαίδευση και Πρόβλεψη Μοντέλων Ομαδοποίησης

Οδηγός AI Learning Machine Learning - K-means Εκπαίδευση και Πρόβλεψη Μοντέλων Ομαδοποίησης

K-means μοντέλο ομαδοποίησης

Διαδικασία εκπαίδευσης του μοντέλου ομαδοποίησης K-means

Διαδικασία πρόβλεψης του μοντέλου ομαδοποίησης K-means

Παράδειγμα

Συνοψίζω

Προσωπικό προφίλ

τα στοιχεία επικοινωνίας μου