Condivisione della tecnologia

Domande della prova scritta SQL [Data Post]

2024-07-12

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina

Il limite di tempo per la prova scritta per il reclutamento in outsourcing del gruppo di analisi dei dati degli account video è di 45 minuti.

La domanda si basa sulla struttura di 3 tabelle. Scrivere il codice SQL specifico per risolvere il problema (definizione della categoria divertente: classificazione del video o classificazione del creatore del video come "divertente") l

Domanda 1: genera una tabella DWS della categoria commedia per analizzare i 3 video recenti dell'autore: genera i 3 video recentemente pubblicati da ciascun creatore di video user_id, l'esposizione nell'ultima settimana e il numero totale di Mi piace. I campi di output sono obbligatori: Creatore video user_id, numero di utenti esposti, numero di utenti Mi piace, numero di esposizioni, numero di Mi piace

  1. SELECT
  2. vu.video_user_id AS user_id,
  3. count( DISTINCT uva.video_id ) AS video_count,
  4. sum( CASE WHEN uva.action_type = 1 THEN 1 ELSE 0 END ) AS exposure_user_count,
  5. sum( CASE WHEN uva.action_type = 2 THEN 1 ELSE 0 END ) AS like_user_count,
  6. sum( CASE WHEN uva.action_type = 1 THEN 1 ELSE 0 END ) AS exposeure_count,
  7. sum( CASE WHEN uva.action_type = 2 THEN 1 ELSE 0 END ) AS like_count
  8. FROM
  9. t_user_video_action_d uva
  10. JOIN t_video_d v ON uva.video_id = v.video_id
  11. JOIN t_video_user_d vu ON v.video_user_id = vu.video_user_id
  12. WHERE
  13. v.video_type = ‘搞笑’
  14. AND uva.ds >= to_date ( to_char ( SYSDATE,’ YYYYMMDD’ ) - 7,’ YYYYMMDD’ )
  15. GROUP BY
  16. vu.video_user_id
  17. ORDER BY
  18. vu.video_user_id;

Domanda 2: genera un risultato numerico: nel video creato il 20221103, se la descrizione del video contiene le due parole chiave "barzellette divertenti" e "talk show", è "contenuto divertente". Se non contiene queste due parole chiave è "contenuti non divertenti" e il risultato finale è 20221103 numero giornaliero di video divertenti e non divertenti con i duplicati rimossi.

  1. SELECT
  2. count( DISTINCT CASE WHEN v.video_description LIKE%搞笑段子%OR v.video_description LIKE%脱口秀%THEN video_id ELSE NULL END ) AS funny_count,
  3. Count( DISTINCT CASE WHEN v.video_description NOT LIKE%搞笑段子%AND v.video_description NOT LIKE%脱口秀%THEN v.video_id ELSE NULL END ) AS not_funny_count form t_video_d v
  4. WHERE
  5. v.ds = to_date ( ‘ 20221103’,’ YYYYMMDD’ );

Domanda 3: Calcola il timestamp della prima esposizione video di ciascun utente ogni giorno. Maggiore è la velocità di esecuzione, meglio è. I campi di output sono data, ID utente e timestamp.

  1. SELECT
  2. uva.ds AS date,
  3. uva.user_id,
  4. min( uva.TIMESTAMP ) AS first_exposure_timestamp form t_user_video_action_d uva
  5. WHERE
  6. uva.action_type = 1
  7. GROUP BY
  8. uva.user_id,
  9. uva.ds;

Domanda 4: genera una tabella DWS per interrogare il tasso di conservazione di 7 giorni degli utenti attivi esposti in qualsiasi data passata. I campi di output sono data, ID utente e tasso di conservazione di 7 giorni. La struttura della tabella specifica è la seguente: Tabella 1 Tabella del comportamento dell'utente: t_user_video_action_d l Partizione: ds (formato aaaaMMgg) lChiave primaria: user_id, video_id lSignificato: aggregazione di tutti i comportamenti di un utente su un video, incremento giornaliero Nome campo Tipo significato campo

  1. SELECT
  2. uvu.ds AS date,
  3. uvu.video_user_id AS user_id,
  4. CASE
  5. WHEN count( DISTINCT first_action.video_user_id ) = 0 THEN
  6. 0 ELSE sum( CASE WHEN to_char ( uvu.ds,’ YYYYMMDD’ ) BETWEEN first_action.first_ds AND first_action.first_ds + 6 THEN 1 ELSE 0 END )
  7. END / count( distion first_action.video_user_id ) AS retention_rate Form t_video_user_d uvu
  8. JOIN ( SELECT user_id, video_id, ds AS first_ds form t_user_video_action_d WHERE action_type = 1 GROUP BY user_id, video_id, ds ORDER BY ds ASC ) first_action ON uvu.video_user_id = first_action.user_id
  9. GROUP BY
  10. uvu.video_user_id,
  11. uvu.ds;