Cognitio systematica de H264 videndi coding (03) processus notitiae compressionis et conceptus

Systematica cognita H264 coding (03) processus notitiae compressionis et conceptus affinis

2024-07-12

Nota: Ad modum discendi Aurei Circuli referimus (Quae est Regula Aurea Circuli? -> Exemplar Regulae Aureae Circuli, hic articulus utitur: quare-quid) ad discendum audio H264 videre modum descriptam. Haec series articulorum spectat ad cognitionem systematis cognitionis ac methodi practicae de videndi modum delatam. Scitote quomodo se res habeat, nostis cur ita sit. Eodem tempore magis emphasim ponitur in systematibus cognitionis constituendis.

Ad hoc articulum, maxime loquimur de processu notitiae H.264 compressionis et conceptus affinis. H.264 Compressio data unum tantum propositum habet, ad comprimendum, comprimendum et re-comprimendum ad redigendum magnitudinem datarum video dum prospiciendo imaginem qualitatis quantum fieri potest. Priusquam cognita H.264 data compressione, primum intellegendum est: Etsi multae notiones et methodi in hoc processu implicantur, omnes modi et processus ad hoc sunt: compressio.

I Interpretatio processus notitia compressionis H.264

Copressionis notitia processus H.264 maxime compendiatur ut gradus sequentes clavis: macroblock divisio et divisio sub-obstructionum -> compages compages -> frame praedictum -> integer discretus cosinus transform (DCT) -> compressio CABAC. Dilatationis specificae instructiones sunt hae.

1.1 divide tortor caudices && divide in sub- caudices

Scandalum Macro: Intelligi potest quod, cum compago visibilis ad quiddam encoder H264 mittitur, encoder in singulis imaginibus tortor caudices dividit. Defalta, H264 descriptam area 16X16 imaginum ut macroblock utitur (H265 utitur area imaginum 64X64).

Altiore effectus post macroblock divisionem

Eodem tempore, in pictura supra, actu 16X16 pixel macronum stipitem in minores caudices dividere possumus. Magnitudo sub-obstructionum potest esse 8X16､16X8､8X8､4X8､8X4､4X4 valde flexibilis est. Propositum dividere in caudices iterum est notitias quam minimas notare. Post macroblocks divisi, omnes imagines in cache encoder H264 dividi possunt.

Divisio macroblocks et sub-obstructionum video coding ad analysim et processum contentorum video permittit accuratius et magis efficacem notitiarum compressionem consequi. Tabulae video in macroblocks imaginum magnitudinum 16x16 divisae, et hae macroblockores ulterius in caudices minores dividi possunt ut 8x8, 8x4, 4x8, etc. ad imaginis complexionem accommodandam.

1.2 Frame grouping

Artus compages (GOP structurae) ante praenuntiationem intra praedictionem et inter praedictionem definitur. In progressione video modum translitterandi, occasus compagis compagis est unus e gradibus initialibus, qui ordinem ac ordinem tabularum video descriptarum determinat. Praecipuum propositum compagis compagis est ad redigendum data redundantia. Video data redundantia maxime in duo genera divisa;

Temporalis notitia redundantia, quae usum praenuntiationis inter-fractionis requirit compressionem, maiorem rationem reddit(Quia, si camera secundae tabulae capitum triginta capitum, hae 30 tabulae notitiarum in pluribus se habent. Possunt plus quam triginta tabulae notitiarum esse, et forte justos tabularum notitiarum singulariter propinquae sunt. Et pro ratione relatio est. praesertim Close tabulae, tantum opus est ut clavisframe servetur(I fingo)data, alia tabulae(B frame and P frame) ;Omnia per hoc arto praedicari possunt secundum certas regulas, ut video notitia plus temporis redundantiam habet).
Spatialis notitia redundantia, quae usum compressionis intra-framinis requirit, proportionem relative parvam rationem reddit.

H264 compages gressibus adjunctio;

Singulis diebus binae tabulae adjacentes pro macroblock comparatione sumptae sunt, et similitudo inter duas tabulas computatur.
Similitudo post quantitatem obtinetur: Si elementa cum differentiis tantum intra 10% punctorum sunt, claritas differentiae nullo plus quam 2% mutatur, et differentia chromatis tantum intra 1% mutatur, credimus tales imagines coniungi posse. in unum coetum.

Cum coetus completur, problema de compendio praedictionis pressionis solvendum incipit.

1.3 Artus praedictionem compressionem

Haec pars maxime includit praedictionem intra- frameam et praedictionem inter machinam. Praedictio intra-fractus est fixa imaginis tabulas comprimere, valorem pixel cuiusque macroblock per 9 diversos modos praedicere, et deinde valorem residua cum imagine originali computare. Praedictio inter-fractus (aestimatio motus et compensatio motus): Nam tabulae P et B tabulae motum vectorem inter priorem machinam vel duas tabulas per aestimationem motus inveniunt, tum motus excambium praesagium faciunt, imaginem praedictam generant et ex Residuo computant. monetae pectora.

Nota: Praedictio intra praenuntiatio et inter praedictum ordo a instrumenti codice coded et instrumenti coding pendet. In exsecutione reali video encoder, hi gradus sunt pars processus enucleationis et ipso facto ab encoder tractantur. Non debet esse qui primus tractat.

1.3.1 Intra praedictionem

Compressio intra-frame vaticinium: problema solvit localis notitiae redundantia. Airspace notitia redundans ad colorem, splendorem, etc. refertur, quod maxime ad informationem quae insensibilis est ad oculum humanum.Principium, quod in intra-framine praedicationis ponitur, est quod oculus humanus aliquem gradum imaginum agnoscit. Valde sensilis est ad candorem frequentiae humilitatis et minus sensitivum ad splendorem frequentiae.(Intelligi potest ut macroblock magnitudinem 16X16. In H264, alia notitia praenuntiatur per summa 16 elementa et 16 elementa ultimi, ita ut pixel notitiarum repraesentationum quae primum requirit 16*16=256, ad 16+ converti possint. 16-1 = XXXI elementa repraesentare informationes)。

1.3.2 Vaticinium inter frame (compensatio motus aestimationis et motus)

Praedictio interframe pressio (motus aestimatio et recompensatio): quaestionem solvit temporis domain notitia redundantia. Plures tabulae sunt in video linealiter ordine chronologico dispositae. Ratio inter tabulas valde fortis est, ut multae notitiae sint quae inter tabulas deleri possunt.Post compressionem in tria genera dividetur: I compago, P compago, B compago.(Explanatio: Principium motus estimationis et recompensationis: H264 encoder primum emittit duas tabulas video datas ex quiddam header in ordine, et deinde facit macroblock intuens. Cum deprehenditur obiectum esse in una imaginibus, eam Quaero situm prope (in fenestra quaerens). Si res in alia pictura hoc tempore invenitur, motus vector obiecti computari potest.。

Nam P tabulae et B tabulae, motus aestimatio adhibetur ad inveniendum motum vectoris inter artubus priorem vel duas tabulas, et tunc motus compensatio praedicta fit ad imaginem praedictam generandam, et residua cum frame currenti computatur.

1.4 Integer discretus cosinus transform (DCTDiscrete Cosme Transform）

Hic gradus maxime DCT transformationem in residuo praedictionis exercet, correlationem localem in notitiarum plurium locorum frequentia vertit, ac deinde quantitat. DCT principaliter adhibetur pro notitia vel compressione imaginum, ratione locali convertens in notas inutiles in dominio frequenti ac deinde quantitatis.(Explicatio: DCT transformatio plus momenti notitiae imaginis simul colligere potest, et parva frequentia arearum regionum et coefficientium directe carpi possunt)。

Summarium: Ordo comprimendi notae fabricae est primum compressionem inter compagem et intra- tionem facere, et deinde DCT transmutationem in notitia residua facere, ad reciprocum datarum tollendam et amplius comprimendam datam. Ut sequitur:

1.5 CABAC compressionem

Compressio CABAC compressio technologiae iactura est et modus entropy coding. Cum CABAC comprimatur et encodedatur, summa frequentia notarum brevium notarum definitur et notitia frequentia gravis in codicibus longis definitur. Haec methodus VLC methodus efficacior eft. Modus entropy coding CABAC (Context-Adaptive Binary Arithmetic Coding) usus est ut coefficientes quantitatis amplius comprimant ad efficientiam compressionem meliorandam. Hic, notitia processus in quattuor gradibus praecedentibus encoded in codice finali amnis utens descriptam algorithmum. Ultimae tabulae compressae divisae sunt in: I tabulae, P tabulae, B tabulae. Post modum compressionis CABAC amissae exsecuta est, codicem vide amnis adeptus est.

II notiones in notitia compressionem processus Related

2.1 Data nugatio tempore et spatio

Spatium notitiarum nugationum et notitiarum temporalium redundantiae sunt duae notiones praecipuae in compressione video.

Interpretatio spatii dundantiae：

Agitur de similitudine seu habitudine inter pixella adjacentia in uno compage visibili, inde in duplicatione data. Ob continuitatem imaginum naturalium, elementa adiacentium tendunt ad similes splendores vel valores coloris.
Exempla typica redundantia spatialis includunt magnas areas monochromatis, graduum, vel textuum lente mutabiles.
Compressio algorithms video, spatialem redundantiam per praenuntiationem spatialem reducere, coding (ut DCT) et alias technologias transformare, imaginem e regione locali ad domain frequentiam converte, et in paucas coefficientes ad finem compressionis consequendam vim intendere.

Interpretatio dationis temporalis：

Refertur ad similitudinem quae est inter tabulas consecutivas seriei video, id est, idem obiectum vel scaena in tabulis consecutivis non signanter visibiliter mutat.
Temporalis redundantia plerumque contingit, cum camera stataria vel obiecta in scaena lente moventur, et solum parva area mutatur in subsequentibus tabulis collatis ad tabulam priorem.
Compressio algorithmorum videntur minuere redundantiam temporalem per technicas artes ut praedictionem interpraesentalem, motum aestimationem et motum compensationis, utens reciproci inter tabulas antecedentes et sequentes praedicere et encode inter-fractus differentias pro plene formando singulas tabulas.

2.2 Interpretatio notitiarum residuarum et notionum relatarum

In H.264 video compressionem, notitia residua refert ad differentiam inter artus video originalis et compagem praedictam. Simul, si vis profundiorem cognitionem residualium notitiarum habere, notiones sequentes intelligere debes, ut infra ostendetur;

praedicta frame : Per modum videndi modum translitterandi, intra praedictionem (Intra praedictionem) vel inter praedictionem (Inter Prediction) generare tabulas praedictas adhibebitur. Praenuntiatio intra pixel innititur notitia de currentis tabulis, cum inter praedictionem motus mercedis notitiarum priorum vel subsequentium tabularum fundatur.
original frame: Refert ad tabulas imaginis originales actu captas in serie vide.
calculi RELICTUM : Residua notitia computatur subtrahendo frameam praedictam ex corpore originali. Residua data significat differentiam inter corpus praedictum et artus originalis.

Fundamento notionum suprascriptorum, ulterius notiones residuas notas intelligere possumus;

Notitia residua plerumque fortuiti spatialis altam habere solet, quia praenuntiatio machinae plus ex notitia superuacanea removit. Haec fortuiti notitia residua comprimendi per transformationem et quantitatem aptissima facit.
Post data residua discursum ab Integer Discreti Cosme Transform (IDCT) et quantitatis, moles notitiarum signanter minui potest. Transmutatio duas dimensiones spatiales notitias residuas in frequentes informationes convertit, dum quantitas accuratam horum coefficientium minuit et singula quae oculo humano imperceptibilia sunt aufert.

Propositum modum enucleandi notitias residuas est ut morsum video notitiarum adhuc minuere, servato imaginis qualitate quam maxime. Eodem tempore compressio efficax notitiarum residualium pendet ad efficientiam H.264 descriptam, quia directe afficit qualitatem video encoded et band latitudo repositionis inquisitae vel transmissionis.

2.3 Entropy coding notiones relatas et interpretatio extensa

Entropy coding est ars compressionis notae detrimentosa innixa in notione notionum entropiae et tendit ad notitias repraesentandas quam brevissime quam maxime. In nucleo notionis entropy coding est pauciora frena collocare ad symbola quae magis evenire solent, et plura ad symbola quae rarius apparentia collocant. Hoc modo desideratus spatium repositionis seu band latitudo transmissionis minuitur quia mediocris bitrate totius notitiae statutorum minuitur.

Entropy coding saepe pro textu et quibusdam speciebus comprimendi notarum specificarum adhibitus est, et signanter pressionem efficientiam emendare potest, praesertim cum notitia notabili probabilitatis non-uniformis distributionem habet. In compressione videndi coding, modi coding entropy maxime propinqua ad compressionem video maxime sequentes includunt:

Huffman Coding : Huffman coding entropy coding technologia fundamentalis usus est in multis signis compressionis video (qualis est series JPEG, MPEG). Unicuique symboli signum variabile longitudinis assignat per lignum Huffman constructum ex frequentia symboli occurrentis.
Arithmetica Coding : Arithmetica coding in quibusdam signis compressionis video adhibita (ut JPEG-LS, JPEG 2000). Intervallo fracto utitur ad probabilitatem distributionis initus datae repraesentandam et plerumque melioris compressionis efficientiam praebet quam Huffman coding.
Contextus substructio adaptiva arithmeticae binarii coding (CABAC) : CABAC methodus coding entropy adhibita in H.264/AVC et H.265/HEVC signa compressionis video. Notiones arithmeticae coding et contextus adaptationis coniungit, et exemplar probabilisticum coding in contextual informatione fundatum dynamice potest accommodare, eoque efficacius coding.
Longitudo variabilis Coding (VLC) : VLC terminus generalis est ad methodos coding describendas, incluso Huffman coding, qui notas notas longitudinis variabiles assignant. In compressione video, VLC consuevit referre modum modum translitterandi adhibitum ad coefficientes transformandi et cetera.

In compressione video, entropy coding est gradus finalis modi delatam adhibita ut notitias residuas post intra- et inter-praedictionem encode. Data residua differentia est inter notitias originalis et notitias praedictas et plerumque minorem vim habet et probabilitatem magis inaequalem distributionem. Per entropy coding, aliquantulus rate of residua harum notitiarum ulterius reduci potest, eo quod propositum comprehendendi video notitiae assequendum.

Technology sharing