Compartilhamento de tecnologia

Perguntas de teste escritas de SQL [Data Post]

2024-07-12

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina

O tempo limite para a prova escrita para recrutamento de terceirização de grupo de análise de dados de contas de vídeo é de 45 minutos.

A questão é baseada na estrutura de 3 tabelas. Escreva o código SQL específico para resolver o problema (definição da categoria engraçada: classificação do vídeo ou classificação do criador do vídeo como "engraçado") l.

Pergunta 1: Gere uma tabela dws de categoria de comédia para analisar os 3 vídeos recentes do autor: produza os 3 vídeos lançados recentemente por cada criador de vídeo user_id, a exposição na semana passada e o número total de curtidas. Os campos de saída são obrigatórios: Criador de vídeo; user_id, número de usuários expostos, número de usuários curtidos, número de exposições, número de curtidas

  1. SELECT
  2. vu.video_user_id AS user_id,
  3. count( DISTINCT uva.video_id ) AS video_count,
  4. sum( CASE WHEN uva.action_type = 1 THEN 1 ELSE 0 END ) AS exposure_user_count,
  5. sum( CASE WHEN uva.action_type = 2 THEN 1 ELSE 0 END ) AS like_user_count,
  6. sum( CASE WHEN uva.action_type = 1 THEN 1 ELSE 0 END ) AS exposeure_count,
  7. sum( CASE WHEN uva.action_type = 2 THEN 1 ELSE 0 END ) AS like_count
  8. FROM
  9. t_user_video_action_d uva
  10. JOIN t_video_d v ON uva.video_id = v.video_id
  11. JOIN t_video_user_d vu ON v.video_user_id = vu.video_user_id
  12. WHERE
  13. v.video_type = ‘搞笑’
  14. AND uva.ds >= to_date ( to_char ( SYSDATE,’ YYYYMMDD’ ) - 7,’ YYYYMMDD’ )
  15. GROUP BY
  16. vu.video_user_id
  17. ORDER BY
  18. vu.video_user_id;

Pergunta 2: Produza um resultado numérico: No vídeo criado em 20221103, se a descrição do vídeo contiver as duas palavras-chave "piadas engraçadas" e "talk show", será "conteúdo engraçado". "conteúdo não engraçado", e o resultado final é 20221103, número diário de vídeos engraçados e não engraçados com duplicatas removidas.

  1. SELECT
  2. count( DISTINCT CASE WHEN v.video_description LIKE%搞笑段子%OR v.video_description LIKE%脱口秀%THEN video_id ELSE NULL END ) AS funny_count,
  3. Count( DISTINCT CASE WHEN v.video_description NOT LIKE%搞笑段子%AND v.video_description NOT LIKE%脱口秀%THEN v.video_id ELSE NULL END ) AS not_funny_count form t_video_d v
  4. WHERE
  5. v.ds = to_date ( ‘ 20221103’,’ YYYYMMDD’ );

Pergunta 3: Calcule o carimbo de data/hora da primeira exposição de vídeo de cada usuário todos os dias. Quanto mais rápida for a velocidade de execução, melhor. Os campos de saída são data, ID do usuário e carimbo de data/hora.

  1. SELECT
  2. uva.ds AS date,
  3. uva.user_id,
  4. min( uva.TIMESTAMP ) AS first_exposure_timestamp form t_user_video_action_d uva
  5. WHERE
  6. uva.action_type = 1
  7. GROUP BY
  8. uva.user_id,
  9. uva.ds;

Pergunta 4: Gere uma tabela dws para consultar a taxa de retenção de 7 dias de usuários ativos expostos em qualquer data no passado. Os campos de saída são data, ID do usuário e taxa de retenção de 7 dias. Tabela 1 Tabela de comportamento do usuário: t_user_video_action_d l Partição: ds (formato yyyyMMdd) lChave primária: user_id, video_id lSignificado: agregação de todos os comportamentos de um usuário em um vídeo, incremento diário Nome do campo Tipo de significado do campo

  1. SELECT
  2. uvu.ds AS date,
  3. uvu.video_user_id AS user_id,
  4. CASE
  5. WHEN count( DISTINCT first_action.video_user_id ) = 0 THEN
  6. 0 ELSE sum( CASE WHEN to_char ( uvu.ds,’ YYYYMMDD’ ) BETWEEN first_action.first_ds AND first_action.first_ds + 6 THEN 1 ELSE 0 END )
  7. END / count( distion first_action.video_user_id ) AS retention_rate Form t_video_user_d uvu
  8. JOIN ( SELECT user_id, video_id, ds AS first_ds form t_user_video_action_d WHERE action_type = 1 GROUP BY user_id, video_id, ds ORDER BY ds ASC ) first_action ON uvu.video_user_id = first_action.user_id
  9. GROUP BY
  10. uvu.video_user_id,
  11. uvu.ds;