1.1 Προβλήματα που παρουσιάζονται στην όραση υπολογιστή (Computer vision)
Μια πρόκληση κατά την εφαρμογή της όρασης υπολογιστή είναιεισαγωγή δεδομένωνΜπορεί να είναι πολύ μεγάλο.
Το μέγεθος δεδομένων μιας μικρής εικόνας 64×64 είναι 64×64×3 (3 έγχρωμα κανάλια).Άρα το ιδιοδιάνυσμά μας xxΧΗ διάσταση είναι 12288.
Για μια εικόνα 1000×1000, η διάσταση του διανύσματος χαρακτηριστικών φτάνει τα 1000×1000×3.
Εάν υπάρχουν 1000 κρυφές μονάδες στο πρώτο κρυφό στρώμα και όλα τα βάρη σχηματίζουν έναν πίνακα W [ 1 ] W^{[1]}W[1] . Το μέγεθος αυτού του πίνακα σε ένα τυπικό πλήρως συνδεδεμένο δίκτυο είναι 1000×3 εκατομμύρια. Για να γίνει αυτό, πρέπει να εκτελέσουμε έναν υπολογισμό συνέλιξης,
1.2 Παράδειγμα λειτουργίας συνέλιξης: Παράδειγμα ανίχνευσης άκρων
Η λειτουργία συνέλιξης είναι το πιο βασικό στοιχείο του συνελικτικού νευρωνικού δικτύου η ανίχνευση άκρων χρησιμοποιείται ως εισαγωγικό παράδειγμα.
1.2.1 Βήματα ανίχνευσης ακμών
Όταν ανιχνεύουμε αντικείμενα εικόνας, μπορούμε να ανιχνεύσουμε κάθετες ακμές στην εικόνα.
Τραβήξτε μια εικόνα σε κλίμακα του γκρι 6×6. Επειδή είναι μια εικόνα σε κλίμακα του γκρι, είναι μια μήτρα 6×6×1,
Για να εντοπίσετε κάθετες ακμές σε μια εικόνα, μπορείτε να δημιουργήσετε έναν πίνακα 3x3 (φίλτρο/πυρήνα) [ 1 0 − 1 1 0 − 1 1 0 − 1 ] start{bmatrix}1