Nozioni di base per iniziare con audio e video: argomento H.264 (12) - Implementazione del calcolo della risoluzione video tramite attributi SPS nel codice sorgente FFmpeg

2024-07-12

I. Introduzione

Nella sezione precedente "Nozioni di base per iniziare con audio e video: argomento H.264 (11) - formula per il calcolo della risoluzione video "", descrive la formula per calcolare la risoluzione del video codificato H.264 attraverso gli attributi in SPS. Questo articolo spiega l'implementazione del calcolo della risoluzione video nel codice sorgente FFmpeg.

2. Implementazione del calcolo della risoluzione video nel codice sorgente FFmpeg

Dall'articolo "Nozioni di base per iniziare con audio e video: argomento H.264 (10) - Analisi della struttura che memorizza gli attributi SPS e la funzione di decodifica SPS nel codice sorgente FFmpeg》, possiamo sapere che il codice sorgente di FFmpeg decodifica SPS tramite la funzione ff_h264_decode_seq_parameter_set per ottenere gli attributi in SPS.

Nella funzione ff_h264_decode_seq_parameter_set è presente il seguente codice. Attraverso la seguente parte di codice si ottengono gli attributi necessari per calcolare la risoluzione video:


int ff_h264_decode_seq_parameter_set(GetBitContext *gb, AVCodecContext *avctx,
                                     H264ParamSets *ps, int ignore_truncation)
{
    //...
    
    sps->gaps_in_frame_num_allowed_flag = get_bits1(gb);
    sps->mb_width                       = get_ue_golomb(gb) + 1;
    sps->mb_height                      = get_ue_golomb(gb) + 1;
 
    sps->frame_mbs_only_flag = get_bits1(gb);
 
    if (sps->mb_height >= INT_MAX / 2U) {
        av_log(avctx, AV_LOG_ERROR, "height overflown");
        goto fail;
    }
    sps->mb_height *= 2 - sps->frame_mbs_only_flag;
 
    //...
 
    sps->crop = get_bits1(gb);
    if (sps->crop) {
        unsigned int crop_left   = get_ue_golomb(gb);
        unsigned int crop_right  = get_ue_golomb(gb);
        unsigned int crop_top    = get_ue_golomb(gb);
        unsigned int crop_bottom = get_ue_golomb(gb);
        int width  = 16 * sps->mb_width;
        int height = 16 * sps->mb_height;
 
        if (avctx->flags2 & AV_CODEC_FLAG2_IGNORE_CROP) {
            av_log(avctx, AV_LOG_DEBUG, "discarding sps cropping, original "
                                           "values are l:%d r:%d t:%d b:%dn",
                   crop_left, crop_right, crop_top, crop_bottom);
 
            sps->crop_left   =
            sps->crop_right  =
            sps->crop_top    =
            sps->crop_bottom = 0;
        } else {
            int vsub   = (sps->chroma_format_idc == 1) ? 1 : 0;
            int hsub   = (sps->chroma_format_idc == 1 ||
                          sps->chroma_format_idc == 2) ? 1 : 0;
            int step_x = 1 << hsub;
            int step_y = (2 - sps->frame_mbs_only_flag) << vsub;
 
            if (crop_left  > (unsigned)INT_MAX / 4 / step_x ||
                crop_right > (unsigned)INT_MAX / 4 / step_x ||
                crop_top   > (unsigned)INT_MAX / 4 / step_y ||
                crop_bottom> (unsigned)INT_MAX / 4 / step_y ||
                (crop_left + crop_right ) * step_x >= width ||
                (crop_top  + crop_bottom) * step_y >= height
            ) {
                av_log(avctx, AV_LOG_ERROR, "crop values invalid %d %d %d %d / %d %dn",     
                      crop_left, crop_right, crop_top, crop_bottom, width, height);
                goto fail;
            }
 
            sps->crop_left   = crop_left   * step_x;
            sps->crop_right  = crop_right  * step_x;
            sps->crop_top    = crop_top    * step_y;
            sps->crop_bottom = crop_bottom * step_y;
        }
    } else {
        sps->crop_left   =
        sps->crop_right  =
        sps->crop_top    =
        sps->crop_bottom =
        sps->crop        = 0;
    }
 
    //...
}

Quindi nella funzione parse_nal_units del file sorgente libavcodec/h264_parser.c del codice sorgente di FFmpeg, c'è il seguente codice:


static inline int parse_nal_units(AVCodecParserContext *s,
                                  AVCodecContext *avctx,
                                  const uint8_t * const buf, int buf_size)
{
    //...
    
    for (;;) {
        switch (nal.type) {
        case H264_NAL_SPS:
            ff_h264_decode_seq_parameter_set(&nal.gb, avctx, &p->ps, 0);
            break;
         
        //...
 
        case H264_NAL_IDR_SLICE:
        
        //...
 
        s->coded_width  = 16 * sps->mb_width;
        s->coded_height = 16 * sps->mb_height;
        s->width        = s->coded_width  - (sps->crop_right + sps->crop_left);
        s->height       = s->coded_height - (sps->crop_top   + sps->crop_bottom);
        if (s->width <= 0 || s->height <= 0) {
            s->width  = s->coded_width;
            s->height = s->coded_height;
        }
        //... 
        }
        //...
    }
}

Puoi vedere che nella funzione parse_nal_units, la risoluzione video è finalmente ottenuta attraverso la seguente istruzione:


s->width = s->coded_width - (sps->crop_right + sps->crop_left);
s->height = s->coded_height - (sps->crop_top + sps->crop_bottom);

Puoi vedere l'implementazione del calcolo della risoluzione video nel codice sorgente di FFmpeg e nell'articolo "Nozioni di base per iniziare con audio e video: argomento H.264 (11) - formula per il calcolo della risoluzione videoLe formule descritte in sono coerenti.

Condivisione della tecnologia

Nozioni di base per iniziare con audio e video: argomento H.264 (12) - Implementazione del calcolo della risoluzione video tramite attributi SPS nel codice sorgente FFmpeg

I. Introduzione

2. Implementazione del calcolo della risoluzione video nel codice sorgente FFmpeg

Profilo personale

le mie informazioni di contatto