기술나눔

알고리즘 면접 질문_바이트

2024-07-12

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina

질문 1: 변압기 매트릭스 차원 분석 및 멀티헤드 세부 설명:

상세링크 1
상세링크 2

질문 2: 변환기 구조, 프로세스, 차원 변환, 인코더, 디코더:

멀티 헤드의 크기를 변경하는 방법: 먼저 q, k, v의 입력 터미널을 처리하여 해당 크기가 embedding_size/nums_head가 되도록 합니다. 마지막으로 Attention 레이어에서 최종 접합이 이루어집니다.이것이 이유입니다: 헤드 수는 embedding_size로 나눌 수 있어야 합니다.
주의: Q와 K를 통해 주의 가중치를 계산한 다음 V에 작용하여 전체 가중치와 출력을 얻습니다.
상세링크

질문 3: p-튜닝, lora 및 어댑터의 자세한 알고리즘:

p-튜닝
로라
어댑터

질문 4: 평가 프레임워크의 작업은 무엇입니까? cblue

질문 5: 어떤 모델이 훈련되었는지, 데이터 세트 문제

질문 6: cv, deepsortv3, yolo의 개발 역사, yolo의 백본

질문 7: 데이터로더와 데이터세트의 차이점:

ⅰ. 데이터세트는 전통적인 클래스이며, 사용자는 특성 요구 사항에 따라 특정 클래스를 설정합니다.
https://huggingface.co/docs/datasets/loading
ⅱ. 데이터 로더는 데이터 세트에 정의된 클래스를 수용하고 이를 배치로 나누어 후속 교육, 추론 및 기타 작업을 용이하게 합니다.
ⅲ. 데이터세트는 데이터세트의 특징을 검색하고 한 번에 하나의 샘플에 라벨을 붙입니다. Dataloader가 모델을 교육할 때 일반적으로 샘플을 "미니 배치"로 전달하고 각 기간의 데이터를 재구성하여 모델 과적합을 줄입니다. 여기에는 각 시대 사이에 각 배치를 중단할지 여부를 결정하는 셔플이 있습니다.