Bases pour démarrer avec l'audio et la vidéo : sujet H.264 (12) - Implémentation du calcul de la résolution vidéo via les attributs SPS dans le code source FFmpeg

2024-07-12

Introduction

Dans la section précédente "Notions de base pour démarrer avec l'audio et la vidéo : sujet H.264 (11) - formule de calcul de la résolution vidéo "", décrit la formule de calcul de la résolution de la vidéo codée H.264 via les attributs de SPS. Cet article explique l'implémentation du calcul de la résolution vidéo dans le code source de FFmpeg.

2. Implémentation du calcul de la résolution vidéo dans le code source de FFmpeg

Extrait de l'article "Bases pour démarrer avec l'audio et la vidéo : sujet H.264 (10) - Analyse de la structure qui stocke les attributs SPS et de la fonction de décodage SPS dans le code source FFmpeg》, on peut savoir que le code source de FFmpeg décode SPS via la fonction ff_h264_decode_seq_parameter_set pour obtenir les attributs dans SPS.

Il y a le code suivant dans la fonction ff_h264_decode_seq_parameter_set. Grâce à la partie suivante du code, les attributs nécessaires au calcul de la résolution vidéo sont obtenus :


int ff_h264_decode_seq_parameter_set(GetBitContext *gb, AVCodecContext *avctx,
                                     H264ParamSets *ps, int ignore_truncation)
{
    //...
    
    sps->gaps_in_frame_num_allowed_flag = get_bits1(gb);
    sps->mb_width                       = get_ue_golomb(gb) + 1;
    sps->mb_height                      = get_ue_golomb(gb) + 1;
 
    sps->frame_mbs_only_flag = get_bits1(gb);
 
    if (sps->mb_height >= INT_MAX / 2U) {
        av_log(avctx, AV_LOG_ERROR, "height overflown");
        goto fail;
    }
    sps->mb_height *= 2 - sps->frame_mbs_only_flag;
 
    //...
 
    sps->crop = get_bits1(gb);
    if (sps->crop) {
        unsigned int crop_left   = get_ue_golomb(gb);
        unsigned int crop_right  = get_ue_golomb(gb);
        unsigned int crop_top    = get_ue_golomb(gb);
        unsigned int crop_bottom = get_ue_golomb(gb);
        int width  = 16 * sps->mb_width;
        int height = 16 * sps->mb_height;
 
        if (avctx->flags2 & AV_CODEC_FLAG2_IGNORE_CROP) {
            av_log(avctx, AV_LOG_DEBUG, "discarding sps cropping, original "
                                           "values are l:%d r:%d t:%d b:%dn",
                   crop_left, crop_right, crop_top, crop_bottom);
 
            sps->crop_left   =
            sps->crop_right  =
            sps->crop_top    =
            sps->crop_bottom = 0;
        } else {
            int vsub   = (sps->chroma_format_idc == 1) ? 1 : 0;
            int hsub   = (sps->chroma_format_idc == 1 ||
                          sps->chroma_format_idc == 2) ? 1 : 0;
            int step_x = 1 << hsub;
            int step_y = (2 - sps->frame_mbs_only_flag) << vsub;
 
            if (crop_left  > (unsigned)INT_MAX / 4 / step_x ||
                crop_right > (unsigned)INT_MAX / 4 / step_x ||
                crop_top   > (unsigned)INT_MAX / 4 / step_y ||
                crop_bottom> (unsigned)INT_MAX / 4 / step_y ||
                (crop_left + crop_right ) * step_x >= width ||
                (crop_top  + crop_bottom) * step_y >= height
            ) {
                av_log(avctx, AV_LOG_ERROR, "crop values invalid %d %d %d %d / %d %dn",     
                      crop_left, crop_right, crop_top, crop_bottom, width, height);
                goto fail;
            }
 
            sps->crop_left   = crop_left   * step_x;
            sps->crop_right  = crop_right  * step_x;
            sps->crop_top    = crop_top    * step_y;
            sps->crop_bottom = crop_bottom * step_y;
        }
    } else {
        sps->crop_left   =
        sps->crop_right  =
        sps->crop_top    =
        sps->crop_bottom =
        sps->crop        = 0;
    }
 
    //...
}

Ensuite dans la fonction parse_nal_units du fichier source libavcodec/h264_parser.c du code source de FFmpeg, on trouve le code suivant :


static inline int parse_nal_units(AVCodecParserContext *s,
                                  AVCodecContext *avctx,
                                  const uint8_t * const buf, int buf_size)
{
    //...
    
    for (;;) {
        switch (nal.type) {
        case H264_NAL_SPS:
            ff_h264_decode_seq_parameter_set(&nal.gb, avctx, &p->ps, 0);
            break;
         
        //...
 
        case H264_NAL_IDR_SLICE:
        
        //...
 
        s->coded_width  = 16 * sps->mb_width;
        s->coded_height = 16 * sps->mb_height;
        s->width        = s->coded_width  - (sps->crop_right + sps->crop_left);
        s->height       = s->coded_height - (sps->crop_top   + sps->crop_bottom);
        if (s->width <= 0 || s->height <= 0) {
            s->width  = s->coded_width;
            s->height = s->coded_height;
        }
        //... 
        }
        //...
    }
}

Vous pouvez voir que dans la fonction parse_nal_units, la résolution vidéo est finalement obtenue grâce à l'instruction suivante :


s->width = s->coded_width - (sps->crop_right + sps->crop_left);
s->height = s->coded_height - (sps->crop_top + sps->crop_bottom);

Vous pouvez voir l'implémentation du calcul de la résolution vidéo dans le code source de FFmpeg et l'article "Notions de base pour démarrer avec l'audio et la vidéo : sujet H.264 (11) - formule de calcul de la résolution vidéoLes formules décrites dans sont cohérentes.

Partage de technologie

Bases pour démarrer avec l'audio et la vidéo : sujet H.264 (12) - Implémentation du calcul de la résolution vidéo via les attributs SPS dans le code source FFmpeg

Introduction

2. Implémentation du calcul de la résolution vidéo dans le code source de FFmpeg

Profil personnel

mes coordonnées