τα στοιχεία επικοινωνίας μου
Ταχυδρομείο[email protected]
2024-07-12
한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina
Αναλυτικός σύνδεσμος 1
Αναλυτικός σύνδεσμος 2
Πώς να αλλάξετε τις διαστάσεις της πολλαπλής κεφαλής: Αρχικά επεξεργαστείτε τους ακροδέκτες εισόδου των q, k και v, έτσι ώστε οι διαστάσεις τους να είναι embedding_size/nums_head. Τέλος, το τελικό μάτισμα γίνεται στο στρώμα προσοχής.Αυτός είναι ο λόγος: ο αριθμός των κεφαλών πρέπει να διαιρείται με το embedding_size
Προσοχή: Υπολογίστε το βάρος προσοχής μέσω των Q και K και, στη συνέχεια, ενεργήστε με το V για να λάβετε ολόκληρο το βάρος και την έξοδο
Λεπτομερείς σύνδεσμοι
p-tuning
Λόρα
προσαρμογέας
ⅰ Το σύνολο δεδομένων είναι μια παραδοσιακή κλάση και οι χρήστες ορίζουν συγκεκριμένες κλάσεις με βάση χαρακτηριστικές απαιτήσεις.
https://huggingface.co/docs/datasets/loading
ⅱ Το πρόγραμμα φόρτωσης δεδομένων αποδέχεται τις κλάσεις που ορίζονται από το σύνολο δεδομένων και τις διαιρεί σε παρτίδες για να διευκολυνθεί η μετέπειτα εκπαίδευση, η εξαγωγή συμπερασμάτων και άλλες λειτουργίες.
ⅲ Το σύνολο δεδομένων ανακτά τα χαρακτηριστικά του συνόλου δεδομένων μας και επισημαίνει ένα δείγμα τη φορά. Όταν ο dataloader εκπαιδεύει ένα μοντέλο, συνήθως θέλουμε να παραδίδουμε δείγματα σε "μίνι-παρτίδες" και να αναδιοργανώνουμε τα δεδομένα σε κάθε περίοδο για να μειώσουμε την υπερπροσαρμογή του μοντέλου, αυτό έχει μια τυχαία αλλαγή που καθορίζει εάν θα διακοπεί κάθε παρτίδα μεταξύ κάθε εποχής.