minhas informações de contato
Correspondência[email protected]
2024-07-12
한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina
O tempo limite para a prova escrita para recrutamento de terceirização de grupo de análise de dados de contas de vídeo é de 45 minutos.
A questão é baseada na estrutura de 3 tabelas. Escreva o código SQL específico para resolver o problema (definição da categoria engraçada: classificação do vídeo ou classificação do criador do vídeo como "engraçado") l.
Pergunta 1: Gere uma tabela dws de categoria de comédia para analisar os 3 vídeos recentes do autor: produza os 3 vídeos lançados recentemente por cada criador de vídeo user_id, a exposição na semana passada e o número total de curtidas. Os campos de saída são obrigatórios: Criador de vídeo; user_id, número de usuários expostos, número de usuários curtidos, número de exposições, número de curtidas
- SELECT
- vu.video_user_id AS user_id,
- count( DISTINCT uva.video_id ) AS video_count,
- sum( CASE WHEN uva.action_type = 1 THEN 1 ELSE 0 END ) AS exposure_user_count,
- sum( CASE WHEN uva.action_type = 2 THEN 1 ELSE 0 END ) AS like_user_count,
- sum( CASE WHEN uva.action_type = 1 THEN 1 ELSE 0 END ) AS exposeure_count,
- sum( CASE WHEN uva.action_type = 2 THEN 1 ELSE 0 END ) AS like_count
- FROM
- t_user_video_action_d uva
- JOIN t_video_d v ON uva.video_id = v.video_id
- JOIN t_video_user_d vu ON v.video_user_id = vu.video_user_id
- WHERE
- v.video_type = ‘搞笑’
- AND uva.ds >= to_date ( to_char ( SYSDATE,’ YYYYMMDD’ ) - 7,’ YYYYMMDD’ )
- GROUP BY
- vu.video_user_id
- ORDER BY
- vu.video_user_id;
Pergunta 2: Produza um resultado numérico: No vídeo criado em 20221103, se a descrição do vídeo contiver as duas palavras-chave "piadas engraçadas" e "talk show", será "conteúdo engraçado". "conteúdo não engraçado", e o resultado final é 20221103, número diário de vídeos engraçados e não engraçados com duplicatas removidas.
- SELECT
- count( DISTINCT CASE WHEN v.video_description LIKE ‘ %搞笑段子%’ OR v.video_description LIKE ‘ %脱口秀%’ THEN video_id ELSE NULL END ) AS funny_count,
- Count( DISTINCT CASE WHEN v.video_description NOT LIKE ‘ %搞笑段子%’ AND v.video_description NOT LIKE ‘ %脱口秀%’ THEN v.video_id ELSE NULL END ) AS not_funny_count form t_video_d v
- WHERE
- v.ds = to_date ( ‘ 20221103’,’ YYYYMMDD’ );
Pergunta 3: Calcule o carimbo de data/hora da primeira exposição de vídeo de cada usuário todos os dias. Quanto mais rápida for a velocidade de execução, melhor. Os campos de saída são data, ID do usuário e carimbo de data/hora.
- SELECT
- uva.ds AS date,
- uva.user_id,
- min( uva.TIMESTAMP ) AS first_exposure_timestamp form t_user_video_action_d uva
- WHERE
- uva.action_type = 1
- GROUP BY
- uva.user_id,
- uva.ds;
Pergunta 4: Gere uma tabela dws para consultar a taxa de retenção de 7 dias de usuários ativos expostos em qualquer data no passado. Os campos de saída são data, ID do usuário e taxa de retenção de 7 dias. Tabela 1 Tabela de comportamento do usuário: t_user_video_action_d l Partição: ds (formato yyyyMMdd) lChave primária: user_id, video_id lSignificado: agregação de todos os comportamentos de um usuário em um vídeo, incremento diário Nome do campo Tipo de significado do campo
- SELECT
- uvu.ds AS date,
- uvu.video_user_id AS user_id,
- CASE
-
- WHEN count( DISTINCT first_action.video_user_id ) = 0 THEN
- 0 ELSE sum( CASE WHEN to_char ( uvu.ds,’ YYYYMMDD’ ) BETWEEN first_action.first_ds AND first_action.first_ds + 6 THEN 1 ELSE 0 END )
- END / count( distion first_action.video_user_id ) AS retention_rate Form t_video_user_d uvu
- JOIN ( SELECT user_id, video_id, ds AS first_ds form t_user_video_action_d WHERE action_type = 1 GROUP BY user_id, video_id, ds ORDER BY ds ASC ) first_action ON uvu.video_user_id = first_action.user_id
- GROUP BY
- uvu.video_user_id,
- uvu.ds;