Condivisione della tecnologia

Intervista con algoritmo questions_bytes

2024-07-12

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina

Domanda 1: Analisi dimensionale della matrice del trasformatore e spiegazione dettagliata di MultiHead:

Collegamento dettagliato 1
Collegamento dettagliato 2

Domanda 2: struttura del trasformatore, processo, trasformazione dimensionale, codificatore, decodificatore:

Come modificare le dimensioni del multi-head: prima elabora i terminali di input di q, k e v, in modo che le loro dimensioni siano embedding_size/nums_head. Infine, la giunzione finale viene eseguita nello strato di attenzione.Ecco perché: il numero di teste deve essere divisibile per embedding_size
Attenzione: calcola il peso dell'attenzione tramite Q e K, quindi agisci su V per ottenere l'intero peso e l'output
Collegamenti dettagliati

Domanda 3: Algoritmo dettagliato di p-tuning, lora e adattatore:

messa a punto p
la tua
adattatore

Domanda 4: Quali sono i compiti del quadro di valutazione? cblue

Domanda 5: quali modelli sono stati addestrati, problemi con il set di dati

Domanda 6: cv, deepsortv3, la storia dello sviluppo di yolo, la spina dorsale di yolo

Domanda 7: La differenza tra caricatore dati e set di dati:

ⅰ Il set di dati è una classe tradizionale e gli utenti impostano classi specifiche in base ai requisiti caratteristici.
https://huggingface.co/docs/datasets/loading
ⅱ Il caricatore dati accetta le classi definite dal set di dati e le divide in lotti per facilitare il successivo addestramento, inferenza e altre operazioni.
ⅲ Il set di dati recupera le caratteristiche del nostro set di dati ed etichetta un campione alla volta. Quando il dataloader addestra un modello, in genere desideriamo fornire campioni in "mini-batch" e riorganizzare i dati in ciascun periodo per ridurre l'overfitting del modello. Questo ha uno shuffle che determina se interrompere ciascun batch tra ogni epoca;