प्रौद्योगिकी साझेदारी

Hive इत्यस्मिन् दत्तांशप्रकारस्य भण्डारणस्वरूपस्य च सारांशः

2024-07-12

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina

1.दत्तांशप्रकारः

Hive बहुविधदत्तांशप्रकारं समर्थयति, ये द्वयोः वर्गयोः विभक्ताः सन्ति: आदिमदत्तांशप्रकाराः जटिलदत्तांशप्रकाराः च । Hive द्वारा समर्थिताः दत्तांशप्रकाराः निम्नलिखितरूपेण सन्ति ।

आदिमदत्तांशप्रकाराः : १.

1. पूर्णाङ्कप्रकारः : १.

                टिन्यिन्ट् : १. १-बाइट् हस्ताक्षरितः पूर्णाङ्कः
               smallint: . २-बाइट् हस्ताक्षरितः पूर्णाङ्कः
               int: 1 . ४-बाइट् हस्ताक्षरितः पूर्णाङ्कः
                आरम्भः : १. ८-बाइट् हस्ताक्षरितः पूर्णाङ्कः
               तारण: ४-बाइट् एक-सटीकता प्लवमानबिन्दुसङ्ख्या
               द्विद्वार: ८-बाइट् द्विगुणसटीकता प्लवमानबिन्दुसङ्ख्या
                दशमलवः : १. उच्च-सटीकता-सङ्ख्याप्रकारः, सटीकता, स्केलः च निर्दिष्टुं शक्यते, यथा दशमलवः(१०,२) ।

बाइट् : सङ्गणकेषु मूलभूततमेषु भण्डारण-एककेषु अन्यतमः, १ बाइट् ८ बिट्-पर्यन्तं गृह्णाति, आँकडा-परिधिः : नकारात्मक-परिधिः -१२८ तः -१ पर्यन्तं, सकारात्मक-परिधिः : ० तः १२७ पर्यन्तम्

2. स्ट्रिंग् प्रकारः : १.

                सूत्र: चर लम्बाई स्ट्रिंग
               वर्चर्: १. अधिकतमदीर्घतासीमायुक्तः चरदीर्घतायाः तारः, यथा varchar(255) ।
               चर: १. नियतदीर्घता तारः, यथा char(10)

3.तिथि/समयप्रकारः : १.

                समयमुद्रिका : १. तिथिः समयः च युक्तः समयमुद्रिका, नैनोसेकेण्ड् यावत् सटीकः
               दिनाङ्कः: केवलं तिथिभागः एव समाविष्टः, न तु कालभागः
                अन्तरालः : १. कालान्तरं, द्वयोः तिथियोः कालयोः वा भेदं दर्शयितुं प्रयुक्तम्

4.बूलियन प्रकारः : १.

                बूलियन इति: Boolean value, मूल्यं सत्यं वा असत्यं वा अस्ति

5. द्विचक्रीयप्रकारः : १.

                द्विचक्रीय: मनमाना दीर्घतायाः बाइट् सरणी

जटिलदत्तांशप्रकाराः : १.
1.सरणप्रकारः

        सरणी<T> : १. समानप्रकारस्य बहुविधतत्त्वानि, यथा array इत्यादयः क्रमबद्धसूची<int>

2. मानचित्रणप्रकारः

    नक्शा<K, V> : १. कील-मूल्ययुग्मानां अक्रमितसङ्ग्रहः, यत्र कुञ्जी मूल्यं च नक्शा इत्यादि कोऽपि दत्तांशप्रकारः भवितुम् अर्हति<string, int>


    3. संरचनाप्रकारः

         struct<col1: type1, col2: type2, ...> : १. बहुक्षेत्राणि युक्ताः अभिलेखाः, प्रत्येकं क्षेत्रं भिन्नदत्तांशप्रकारस्य भवितुम् अर्हति, उदा.struct<name: string, age: int>

  1. CREATE TABLE example_table (
  2. tinyint_col tinyint,
  3. smallint_col smallint,
  4. int_col int,
  5. bigint_col bigint,
  6. float_col float,
  7. double_col double,
  8. decimal_col decimal(10, 2),
  9. string_col string,
  10. varchar_col varchar(255),
  11. char_col char(10),
  12. timestamp_col timestamp,
  13. date_col date,
  14. boolean_col boolean,
  15. binary_col binary,
  16. array_col array<int>,
  17. map_col map<string, int>,
  18. struct_col struct<name: string, age: int>,
  19. union_col uniontype<int, string>
  20. );

2.Hive सञ्चिकाभण्डारणस्वरूपम्

hive इत्यस्य भण्डारणस्वरूपाः द्वयोः वर्गयोः विभक्ताः सन्ति ।

साधारणपाठसञ्चिकायाः ​​एकः प्रकारः: textfile, या संपीडितः नास्ति तथा च hive इत्यस्य पूर्वनिर्धारितं भण्डारणस्वरूपम् अपि अस्ति ।

एकः वर्गः द्विचक्रीयसञ्चिकासञ्चयः अस्ति :

sequencefile: संपीडितं भविष्यति तथा च load मेथड् इत्यस्य उपयोगेन दत्तांशं लोड् कर्तुं न शक्यते ।

orcfile: संपीडितं भविष्यति तथा च load मेथड् इत्यस्य उपयोगेन दत्तांशं लोड् कर्तुं न शक्यते ।

parquet: संपीडितं भविष्यति तथा च भारविधिना दत्तांशं लोड् कर्तुं न शक्यते।

rcfile: इदं load मेथड् इत्यस्य उपयोगेन दत्तांशं संपीडयितुं शक्नोति, लोड् कर्तुं च न शक्नोति ।

textfile तथा sequencefile इत्येतयोः भण्डारणस्वरूपं पङ्क्तिभण्डारणस्य आधारेण भवति;

सारणीं निर्माय भवन्तः सारणीयाः भण्डारणस्वरूपं निर्दिष्टुं parquet इति रूपेण stored इत्यस्य उपयोगं कर्तुं शक्नुवन्ति, यथा-

  1. create table if not exists stocks_parquet (
  2. track_time string,
  3. url string,
  4. session_id string,
  5. referer string,
  6. ip string,
  7. end_user_id string,
  8. city_id string
  9. )
  10. stored as parquet;

hive इत्यस्य पूर्वनिर्धारितं भण्डारणस्वरूपं परिवर्तयन्तु:

  1. <property>
  2. <name>hive.default.fileformat</name>
  3. <value>TextFile</value>
  4. <description>
  5. Expects one of [textfile, sequencefile, rcfile, orc].
  6. Default file format for CREATE TABLE statement. Users can explicitly override it by CREATE TABLE ... STORED AS [FORMAT]
  7. </description>
  8. </property>
  9. 也可以使用set方式修改:
  10. set hive.default.fileformat=TextFile