2024-07-12
한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina
नोट्: वयं श्रव्य H264 विडियो एन्कोडिंग् ज्ञातुं गोल्डन् सर्कल लर्निङ्ग् मेथड् (गोल्डन् सर्कल नियमः किम्? -> मॉडल् गोल्डन् सर्किल् नियमः, अयं लेखः उपयुज्यते: why-what) इति सन्दर्भयामः । लेखानां एषा श्रृङ्खला विडियो एन्कोडिंग् इत्यस्य ज्ञानव्यवस्थायाः व्यावहारिकपद्धतीनां च अवगमने केन्द्रीभूता अस्ति सैद्धान्तिकपक्षः श्रव्य-दृश्ययोः अवधारणानां उत्पत्तिविषये तथा च विभिन्नानां अवधारणानां मध्ये सम्बन्धानां विषये अधिकं व्याख्यास्यति। कथं इति विद्धि, किमर्थमिति विद्धि। तत्सह ज्ञानव्यवस्थानां स्थापनायां अधिकं बलं दत्तं भवति ।
अस्य लेखस्य कृते वयं मुख्यतया H.264 data compression इत्यस्य प्रक्रियायाः सम्बद्धानां च अवधारणानां विषये वदामः । H.264 आँकडासंपीडनस्य केवलम् एकः एव उद्देश्यः अस्ति, यत् यथासम्भवं चित्रस्य गुणवत्तां सुनिश्चित्य विडियोदत्तांशस्य आकारं न्यूनीकर्तुं संपीडयितुं, संपीडयितुं, पुनः संपीडयितुं च अतः H.264 data compression इति ज्ञातुं पूर्वं प्रथमं अस्माभिः अवगन्तव्यं यत् यद्यपि अस्मिन् प्रक्रियायां बहवः अवधारणाः पद्धतयः च सम्मिलिताः सन्ति तथापि सर्वाणि पद्धतयः प्रक्रियाश्च अस्य प्रयोजनाय एव सन्ति : compression
H.264 इत्यस्य आँकडासंपीडनप्रक्रिया मुख्यतया निम्नलिखितमुख्यपदार्थरूपेण सारांशितः अस्ति: मैक्रोब्लॉकविभाजनं उपखण्डविभाजनं च -> फ्रेमसमूहीकरणं -> फ्रेमपूर्वसूचना -> पूर्णाङ्कविच्छिन्नकोसाइनरूपान्तरणं (DCT) -> CABACसंपीडनं विशिष्टाः विस्तारनिर्देशाः यथा सन्ति ।
मैक्रो ब्लॉक् : एतत् अवगन्तुं शक्यते यत् यदा H264 एन्कोडरस्य बफर मध्ये विडियो फ्रेम प्रेष्यते तदा एन्कोडरः प्रत्येकस्मिन् चित्रे मैक्रो ब्लॉक् विभजति । पूर्वनिर्धारितरूपेण H264 एन्कोडिंग् इत्यनेन मैक्रोब्लॉक् इत्यस्य रूपेण 16X16 पिक्सेल इत्यस्य क्षेत्रस्य उपयोगः भवति (H265 इत्यनेन 64X64 पिक्सेल इत्यस्य क्षेत्रस्य उपयोगः भवति) ।
तस्मिन् एव काले उपरि चित्रे वयं वास्तवतः 16X16 पिक्सेल मैक्रो ब्लॉक् लघु उपखण्डेषु विभक्तुं शक्नुमः । उपखण्डस्य आकारः 8X16〤16X8・8X8・4X8・8X4・4X4 अतीव लचीलाः भवितुम् अर्हति । पुनः उपखण्डेषु विभक्तुं उद्देश्यं अत्यल्पदत्तांशैः सह एतत् दत्तांशं अभिलेखयितुम् अस्ति । मैक्रोब्लॉक्स् विभक्तस्य अनन्तरं H264 एन्कोडर-सञ्चयस्य सर्वाणि चित्राणि समूहीकृत्य स्थापयितुं शक्यन्ते ।
मैक्रोब्लॉक्स् तथा उप-ब्लॉक् इत्येतयोः विभाजनेन विडियो कोडिंग् इत्यनेन विडियो सामग्रीं अधिकसटीकरूपेण विश्लेषितुं संसाधितुं च अधिकं कुशलं आँकडासंपीडनं प्राप्तुं शक्यते विडियो फ्रेम्स १६x१६ पिक्सेल आकारस्य मैक्रोब्लॉक् इत्यत्र विभक्ताः सन्ति, तथा च एतान् मैक्रोब्लॉक् इत्येतत् चित्रसामग्रीणां जटिलतां समायोजयितुं ८x८, ८x४, ४x८ इत्यादिषु लघुखण्डेषु अपि विभक्तुं शक्यते
फ्रेम समूहीकरणं (GOP संरचना) अन्तर्भविष्यवाणीतः अन्तरपूर्वसूचनायाः च पूर्वं परिभाषितं भवति । विडियो एन्कोडिंग् प्रक्रियायां फ्रेम समूहीकरणस्य सेटिंग् प्रारम्भिकपदेषु अन्यतमम् अस्ति, यत् विडियो फ्रेम्स इत्यस्य संगठनं एन्कोडिंग् क्रमं च निर्धारयति । फ्रेम-समूहीकरणस्य मुख्यं उद्देश्यं दत्तांश-अतिरिक्ततां न्यूनीकर्तुं भवति । विडियो डाटा रिडण्डन्सी मुख्यतया द्वयोः वर्गयोः विभक्तः अस्ति : १.
H264 फ्रेम समूहीकरणस्य निष्पादनपदार्थाः:
यदा समूहीकरणं समाप्तं भवति तदा फ्रेम भविष्यवाणी संपीडनस्य समस्या समाधानं प्रारभते ।
अस्मिन् भागे मुख्यतया अन्तर्-फ्रेम-पूर्वसूचना, अन्तर-फ्रेम्-पूर्वसूचना च अन्तर्भवति । अन्तर्-फ्रेम-पूर्वसूचना स्थिर-प्रतिबिम्ब-चतुष्कोणान् संपीडयितुं, ९ भिन्न-विधैः प्रत्येकस्य मैक्रोब्लॉकस्य पिक्सेल-मूल्यं पूर्वानुमानं कर्तुं, ततः मूल-प्रतिबिम्बेन सह अवशिष्ट-मूल्यस्य गणनां कर्तुं च भवति तथा च अन्तर-फ्रेम-अनुमानं (गति-अनुमानं तथा गति-क्षतिपूर्तिः): P फ्रेम् तथा B फ्रेम् इत्येतयोः कृते गति-अनुमानस्य माध्यमेन पूर्व-फ्रेम् अथवा द्वयोः फ्रेमयोः मध्ये गति-सदिशं ज्ञातव्यं, ततः गति-क्षतिपूर्ति-अनुमानं कुर्वन्तु, पूर्वानुमानित-प्रतिबिम्बं जनयन्तु, Residual from इत्यस्य गणनां कुर्वन्तु वर्तमान फ्रेम।
नोटः- अन्तर्-अनुमानस्य अन्तर-अनुमानस्य च क्रमः कोडित-फ्रेमस्य प्रकारस्य कोडिंग्-रणनीत्याः च उपरि निर्भरं भवति । वास्तविक-वीडियो-एन्कोडर-कार्यन्वयने एते पदानि एन्कोडिंग्-प्रक्रियायाः भागाः भवन्ति, एन्कोडर्-द्वारा स्वयमेव नियन्त्रितानि च भवन्ति । न भवितव्यं यत् प्रथमं कः सम्पादयति ।
अन्तर्-फ्रेम भविष्यवाणी संपीडनम् : स्थानिकदत्तांश-अतिरिक्ततायाः समस्यायाः समाधानं करोति । वायुक्षेत्रस्य अनावश्यकदत्तांशः वर्णं, कान्तिम् इत्यादीन् निर्दिशति, यत् मुख्यतया मानवनेत्रस्य प्रति असंवेदनशीलसूचनायाः कृते भवति ।अन्तर्-फ्रेम-भविष्यवाणीयां प्रयुक्तः सिद्धान्तः अस्ति यत् मानव-नेत्रे बिम्बानां निश्चित-परिचयः भवति ।(इदं 16X16 इत्यस्य मैक्रोब्लॉक आकारः इति अवगन्तुं शक्यते। H264 इत्यस्मिन् अन्यदत्तांशस्य पूर्वानुमानं शीर्ष 16 पिक्सेलस्य वामतः 16 पिक्सेलस्य च माध्यमेन भवति, येन पिक्सेलप्रतिपादनसूचना यस्याः मूलतः 16*16=256 इत्यस्य आवश्यकता भवति, सा 16+ इति परिवर्तयितुं शक्यते १६-१ =३१ पिक्सेल् सूचनां प्रतिनिधितुं)。
अन्तर्फ्रेम भविष्यवाणी संपीडनम् (गति-अनुमानं क्षतिपूर्तिं च): समय-क्षेत्र-दत्तांश-अतिरिक्ततायाः समस्यायाः समाधानं करोति । कालक्रमेण रेखीयरूपेण व्यवस्थिताः विडियोमध्ये बहुविधाः फ्रेमाः सन्ति, अतः फ्रेमयोः मध्ये बहुविधाः दत्तांशाः सन्ति ये विलोपयितुं शक्यन्ते ।संपीडनस्य अनन्तरं I frame, P frame, B frame इति त्रयः प्रकाराः विभक्ताः भविष्यन्ति ।(व्याख्यानम् : गति-अनुमानस्य क्षतिपूर्तिस्य च सिद्धान्तः : H264 एन्कोडरः प्रथमं बफर-शीर्षकात् विडियो-दत्तांशस्य द्वौ फ्रेमौ क्रमेण बहिः निष्कासयति, ततः मैक्रोब्लॉक् स्कैनिङ्गं करोति । यदा चित्रेषु एकस्मिन् वस्तु अस्ति इति ज्ञायते तदा सः will समीपस्थं स्थानं अन्वेष्टुम् (अन्वेषणविण्डो मध्ये यदि वस्तु अन्यस्मिन् चित्रे लभ्यते तर्हि अधोलिखितं चित्रं अन्वेषणानन्तरं बिलियर्ड् कन्दुकस्य स्थानं भवति。
P फ्रेम्स तथा B फ्रेम्स कृते पूर्वचक्रस्य अथवा द्वयोः फ्रेमयोः मध्ये गतिसदिशं अन्वेष्टुं गति-अनुमानस्य उपयोगः भवति, ततः पूर्वानुमानित-प्रतिबिम्बं जनयितुं गति-क्षतिपूर्ति-अनुमानं क्रियते, वर्तमान-चतुष्कोणेन सह अवशिष्टस्य गणना भवति
इदं चरणं मुख्यतया भविष्यवाणी अवशिष्टे DCT परिवर्तनं करोति, स्थानिकसहसंबन्धं आवृत्तिक्षेत्रे अप्रासंगिकदत्तांशरूपेण परिवर्तयति, ततः तस्य परिमाणं करोति DCT मुख्यतया आँकडा अथवा चित्रसंपीडनार्थं उपयुज्यते, स्थानिकसहसंबन्धं आवृत्तिक्षेत्रे अप्रासंगिकदत्तांशरूपेण परिवर्तयति ततः तस्य परिमाणं करोति ।(व्याख्यानम् : DCT परिवर्तनेन चित्रस्य अधिकानि महत्त्वपूर्णानि सूचनानि एकत्र एकत्रितुं शक्यन्ते, अपि च अमहत्त्वपूर्णाः आवृत्तिक्षेत्रक्षेत्राणि गुणांकाः च प्रत्यक्षतया क्रॉप् कर्तुं शक्यन्ते)。
सारांशः- फ्रेम-दत्तांशसंपीडनस्य क्रमः प्रथमं अन्तर-फ्रेम-अन्तर-फ्रेम-संपीडनं कर्तुं, ततः अवशिष्टदत्तांशस्य उपरि DCT-रूपान्तरणं कृत्वा आँकडानां सहसंबन्धं दूरीकर्तुं दत्तांशं अधिकं संपीडयितुं च भवति यथा- १.
CABAC संपीडनं हानिरहितसंपीडनप्रौद्योगिकी अस्ति तथा च एन्ट्रोपी कोडिंग् इत्यस्य पद्धतिः अस्ति । यदा CABAC संपीडितं संकेतितं च भवति तदा उच्च-आवृत्ति-दत्तांशः लघु-सङ्केताः इति परिभाषितः भवति, निम्न-आवृत्ति-दत्तांशः दीर्घ-सङ्केतः इति परिभाषितः भवति । एषा पद्धतिः VLC पद्धत्याः अपेक्षया अधिका कार्यक्षमः अस्ति । CABAC (Context-Adaptive Binary Arithmetic Coding) एन्ट्रोपी कोडिंग् पद्धतेः उपयोगः संपीडनदक्षतां सुधारयितुम् क्वाण्टाइज्ड् गुणांकानाम् अग्रे संपीडनार्थं भवति अत्र पूर्वचतुर्षु चरणेषु संसाधितं दत्तांशं एन्कोडिंग् एल्गोरिदम् इत्यस्य उपयोगेन अन्तिमसङ्केतप्रवाहे एन्कोड् भवति । अन्तिमसंपीडितचक्रं विभक्तं भवति : I फ्रेम, P फ्रेम तथा B फ्रेम । CABAC हानिरहितसंपीडनविधिः निष्पादितस्य अनन्तरं विडियोसङ्केतप्रवाहः प्राप्यते ।
स्थानिकदत्तांश-अतिरिक्तता तथा काल-दत्तांश-अतिरिक्तता च विडियो-संपीडने द्वौ मूलभूतौ अवधारणाः सन्ति
स्थानिक अतिरेकस्य व्याख्या:
लौकिक अतिरेक की व्याख्या:
H.264 विडियो संपीडने अवशिष्टदत्तांशः मूलविडियो फ्रेमस्य पूर्वानुमानितचतुष्कोणस्य च मध्ये अन्तरं निर्दिशति । तस्मिन् एव काले यदि भवान् अवशिष्टदत्तांशस्य गहनतया अवगमनं कर्तुम् इच्छति तर्हि निम्नलिखितसंकल्पनाः अवगन्तुं आवश्यकम्, यथा अधः दर्शितम् अस्ति ।
पूर्वानुमानित फ्रेम : विडियो एन्कोडिंग् प्रक्रियायाः समये पूर्वानुमानित-फ्रेम-जननार्थं intra prediction (Intra Prediction) अथवा inter prediction (Inter Prediction) इत्यस्य उपयोगः भविष्यति । अन्तर्भविष्यवाणी वर्तमानचतुष्कोणस्य पिक्सेलसूचनायाः आधारेण भवति, यदा तु अन्तरपूर्वसूचना पूर्वस्य अथवा अनन्तरं चतुष्कोणानां गतिक्षतिपूर्तिसूचनायाः आधारेण भवति
मूल फ्रेम: वास्तविकरूपेण विडियो क्रमे गृहीतानाम् मूलप्रतिबिम्बचतुष्कोणानां निर्दिशति ।
अवशिष्ट गणना : अवशिष्टदत्तांशस्य गणना मूलचक्रात् पूर्वानुमानितं फ्रेमं घटयित्वा भवति । अवशिष्टदत्तांशः पूर्वानुमानितचतुष्कोणस्य मूलचक्रस्य च मध्ये अन्तरं प्रतिनिधियति ।
उपर्युक्तसंकल्पनानां आधारेण अवशिष्टदत्तांशस्य लक्षणं अधिकं अवगन्तुं शक्नुमः : १.
अवशिष्टदत्तांशस्य प्रायः उच्चा स्थानिकयादृच्छिकता भवति यतोहि भविष्यवाणीचतुष्कोणेन अधिकांशः अनावश्यकसूचना निष्कासिता अस्ति । एषा यादृच्छिकता अवशिष्टदत्तांशं परिवर्तनस्य, मात्राकरणस्य च माध्यमेन अग्रे संपीडनार्थं उपयुक्तं करोति ।
अवशिष्टदत्तांशस्य Integer Discrete Cosine Transform (IDCT) तथा क्वाण्टाइजेशनद्वारा संसाधितस्य अनन्तरं दत्तांशस्य परिमाणं महत्त्वपूर्णतया न्यूनीकर्तुं शक्यते । परिवर्तनेन अवशिष्टस्य द्वि-आयामी स्थानिकसूचना आवृत्तिसूचनायां परिणमति, यदा तु क्वाण्टीकरणेन एतेषां गुणांकानाम् सटीकता न्यूनीकरोति, मानवनेत्रेण अगोचरविवरणानि च दूरीकरोति
अवशिष्टदत्तांशस्य एन्कोडिंग् इत्यस्य उद्देश्यं यथासम्भवं चित्रस्य गुणवत्तां निर्वाहयित्वा विडियोदत्तांशस्य बिटरेट् अधिकं न्यूनीकर्तुं भवति । तस्मिन् एव काले अवशिष्टदत्तांशस्य प्रभावी संपीडनं H.264 एन्कोडिंग्-दक्षतायै महत्त्वपूर्णं भवति, यतः एतत् प्रत्यक्षतया एन्कोडेड्-वीडियो-गुणवत्तां आवश्यकं भण्डारणं वा संचरण-बैण्डविड्थं च प्रभावितं करोति
एन्ट्रोपी कोडिंग् सूचना एन्ट्रोपी इत्यस्य अवधारणायाः आधारेण एकः हानिरहितः आँकडासंपीडनप्रविधिः अस्ति तथा च यथासम्भवं न्यूनानि बिट्-सहितं दत्तांशस्य प्रतिनिधित्वं कर्तुं उद्दिश्यते । एन्ट्रोपी कोडिंग् इत्यस्य मूलविचारः अस्ति यत् अधिकसंभावनायुक्तानां चिह्नानां कृते न्यूनानि बिट्-आवंटनं करणीयम्, न्यूनवारं दृश्यमानानां चिह्नानां कृते अधिकानि बिट्-आवंटनं करणीयम् एवं प्रकारेण इष्टं भण्डारणस्थानं वा संचरणबैण्डविड्थं न्यूनीकरोति यतोहि सम्पूर्णस्य दत्तांशसमूहस्य औसतबिटरेट् न्यूनीकरोति ।
एन्ट्रोपी कोडिंग् प्रायः पाठस्य तथा केषाञ्चन विशिष्टप्रकारस्य दत्तांशसंपीडनस्य कृते उपयुज्यते, तथा च एतत् संपीडनदक्षतायां महत्त्वपूर्णं सुधारं कर्तुं शक्नोति, विशेषतः यदा दत्तांशस्य महत्त्वपूर्णतया असमानसंभावनावितरणं भवति विडियो संपीडनकोडिंग् इत्यस्मिन् विडियो संपीडनेन सह अत्यन्तं निकटतया सम्बद्धाः एन्ट्रोपी कोडिंग् पद्धतयः मुख्यतया निम्नलिखितम् अन्तर्भवन्ति ।
विडियो संपीडने एन्ट्रोपी कोडिंग् इति अन्तिमः एन्कोडिंग् चरणः अस्ति यस्य उपयोगः अन्तर्- तथा अन्तर-अनुमानस्य अनन्तरं अवशिष्टदत्तांशस्य एन्कोड् कर्तुं प्रयुक्तः भवति । अवशिष्टदत्तांशः मूलदत्तांशस्य पूर्वानुमानितदत्तांशस्य च मध्ये अन्तरं भवति तथा च सामान्यतया न्यूना ऊर्जा भवति तथा च अधिकं विषमसंभाव्यवितरणं भवति । एन्ट्रोपी कोडिंग् इत्यस्य माध्यमेन एतेषां अवशिष्टदत्तांशस्य बिट्-दरं अधिकं न्यूनीकर्तुं शक्यते, तस्मात् विडियो-दत्तांशस्य संपीडनस्य उद्देश्यं प्राप्तुं शक्यते ।