le mie informazioni di contatto
Posta[email protected]
2024-07-12
한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina
Il limite di tempo per la prova scritta per il reclutamento in outsourcing del gruppo di analisi dei dati degli account video è di 45 minuti.
La domanda si basa sulla struttura di 3 tabelle. Scrivere il codice SQL specifico per risolvere il problema (definizione della categoria divertente: classificazione del video o classificazione del creatore del video come "divertente") l
Domanda 1: genera una tabella DWS della categoria commedia per analizzare i 3 video recenti dell'autore: genera i 3 video recentemente pubblicati da ciascun creatore di video user_id, l'esposizione nell'ultima settimana e il numero totale di Mi piace. I campi di output sono obbligatori: Creatore video user_id, numero di utenti esposti, numero di utenti Mi piace, numero di esposizioni, numero di Mi piace
- SELECT
- vu.video_user_id AS user_id,
- count( DISTINCT uva.video_id ) AS video_count,
- sum( CASE WHEN uva.action_type = 1 THEN 1 ELSE 0 END ) AS exposure_user_count,
- sum( CASE WHEN uva.action_type = 2 THEN 1 ELSE 0 END ) AS like_user_count,
- sum( CASE WHEN uva.action_type = 1 THEN 1 ELSE 0 END ) AS exposeure_count,
- sum( CASE WHEN uva.action_type = 2 THEN 1 ELSE 0 END ) AS like_count
- FROM
- t_user_video_action_d uva
- JOIN t_video_d v ON uva.video_id = v.video_id
- JOIN t_video_user_d vu ON v.video_user_id = vu.video_user_id
- WHERE
- v.video_type = ‘搞笑’
- AND uva.ds >= to_date ( to_char ( SYSDATE,’ YYYYMMDD’ ) - 7,’ YYYYMMDD’ )
- GROUP BY
- vu.video_user_id
- ORDER BY
- vu.video_user_id;
Domanda 2: genera un risultato numerico: nel video creato il 20221103, se la descrizione del video contiene le due parole chiave "barzellette divertenti" e "talk show", è "contenuto divertente". Se non contiene queste due parole chiave è "contenuti non divertenti" e il risultato finale è 20221103 numero giornaliero di video divertenti e non divertenti con i duplicati rimossi.
- SELECT
- count( DISTINCT CASE WHEN v.video_description LIKE ‘ %搞笑段子%’ OR v.video_description LIKE ‘ %脱口秀%’ THEN video_id ELSE NULL END ) AS funny_count,
- Count( DISTINCT CASE WHEN v.video_description NOT LIKE ‘ %搞笑段子%’ AND v.video_description NOT LIKE ‘ %脱口秀%’ THEN v.video_id ELSE NULL END ) AS not_funny_count form t_video_d v
- WHERE
- v.ds = to_date ( ‘ 20221103’,’ YYYYMMDD’ );
Domanda 3: Calcola il timestamp della prima esposizione video di ciascun utente ogni giorno. Maggiore è la velocità di esecuzione, meglio è. I campi di output sono data, ID utente e timestamp.
- SELECT
- uva.ds AS date,
- uva.user_id,
- min( uva.TIMESTAMP ) AS first_exposure_timestamp form t_user_video_action_d uva
- WHERE
- uva.action_type = 1
- GROUP BY
- uva.user_id,
- uva.ds;
Domanda 4: genera una tabella DWS per interrogare il tasso di conservazione di 7 giorni degli utenti attivi esposti in qualsiasi data passata. I campi di output sono data, ID utente e tasso di conservazione di 7 giorni. La struttura della tabella specifica è la seguente: Tabella 1 Tabella del comportamento dell'utente: t_user_video_action_d l Partizione: ds (formato aaaaMMgg) lChiave primaria: user_id, video_id lSignificato: aggregazione di tutti i comportamenti di un utente su un video, incremento giornaliero Nome campo Tipo significato campo
- SELECT
- uvu.ds AS date,
- uvu.video_user_id AS user_id,
- CASE
-
- WHEN count( DISTINCT first_action.video_user_id ) = 0 THEN
- 0 ELSE sum( CASE WHEN to_char ( uvu.ds,’ YYYYMMDD’ ) BETWEEN first_action.first_ds AND first_action.first_ds + 6 THEN 1 ELSE 0 END )
- END / count( distion first_action.video_user_id ) AS retention_rate Form t_video_user_d uvu
- JOIN ( SELECT user_id, video_id, ds AS first_ds form t_user_video_action_d WHERE action_type = 1 GROUP BY user_id, video_id, ds ORDER BY ds ASC ) first_action ON uvu.video_user_id = first_action.user_id
- GROUP BY
- uvu.video_user_id,
- uvu.ds;