Compartilhamento de tecnologia

Perguntas da entrevista sobre algoritmo_bytes

2024-07-12

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina

Pergunta 1: Análise dimensional da matriz do transformador e explicação detalhada do MultiHead:

Link detalhado 1
Link detalhado 2

Pergunta 2: Estrutura do transformador, processo, transformação de dimensão, codificador, decodificador:

Como alterar as dimensões do cabeçote múltiplo: Primeiro processe os terminais de entrada de q, k e v, para que suas dimensões sejam embedding_size/nums_head. Finalmente, a emenda final é feita na camada de atenção.É por isso: o número de cabeças precisa ser divisível por embedding_size
Atenção: Calcule o peso da atenção por meio de Q e K e, em seguida, atue em V para obter todo o peso e saída
Links detalhados

Pergunta 3: Algoritmo detalhado de ajuste p, lora e adaptador:

ajuste p
lora
adaptador

Pergunta 4: Quais são as tarefas do quadro de avaliação? azul

Pergunta 5: Quais modelos foram treinados, problemas com conjuntos de dados

Pergunta 6: cv, deepsortv3, a história de desenvolvimento do yolo, a espinha dorsal do yolo

Pergunta 7: A diferença entre dataloader e conjunto de dados:

ⅰ Conjunto de dados é uma classe tradicional e os usuários definem classes específicas com base em requisitos característicos.
https://huggingface.co/docs/datasets/loading
ⅱ O dataloader aceita as classes definidas pelo conjunto de dados e as divide em lotes para facilitar o treinamento subsequente, inferência e outras operações.
ⅲ O conjunto de dados recupera os recursos do nosso conjunto de dados e rotula uma amostra por vez. Quando o dataloader treina um modelo, geralmente queremos entregar amostras em "minilotes" e reorganizar os dados em cada período para reduzir o overfitting do modelo.