2024-07-12
한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina
इदं Hive इत्यस्मिन् सारणीप्रकारः अस्ति सारणीयां विद्यमानं दत्तांशं बहुषु उपसमूहेषु (विभाजनेषु) विभज्य, प्रत्येकं विभाजनं सारणीयां विशिष्टस्तम्भमूल्येन सह सङ्गतं भवति, प्रश्नप्रदर्शनं तथा च आँकडाप्रबन्धनदक्षतायां सुधारः कर्तुं शक्यते विभाजितसारणीयाः प्रत्येकं विभाजनं पृथक् निर्देशिकायां संगृह्यते, विभाजनं च सारणीयां एकस्य वा अधिकस्य स्तम्भस्य आधारेण परिभाषितं भवति । विभाजितसारणीनां उपयोगस्य मुख्यं उद्देश्यं प्रश्नैः स्कैन् कृतस्य दत्तांशस्य परिमाणं न्यूनीकर्तुं भवति, तस्मात् प्रश्नदक्षतायां सुधारः भवति ।
अत्यधिकविभाजनस्य परिणामेण बहूनां लघुसञ्चिकानां जननं भवितुम् अर्हति, यत् HDFS कार्यक्षमतां MapReduce कार्याणां कार्यक्षमतां च प्रभावितं करोति । लघुसञ्चिकाविलयक्रियाः नियमितरूपेण कर्तुं आवश्यकाः सन्ति ।
- CREATE TABLE customer_data (
- customer_id STRING,
- name STRING,
- age INT,
- email STRING
- )
- PARTITIONED BY (city STRING)
- STORED AS ORC;
-
- select *
- from customer_data;
-
- -- 插入 New York 的数据
- INSERT INTO TABLE customer_data PARTITION (city='New York')
- VALUES
-
- -- 插入 Los Angeles 的数据
- INSERT INTO TABLE customer_data PARTITION (city='Los Angeles')
- VALUES
-
- -- 插入 Chicago 的数据
- INSERT INTO TABLE customer_data PARTITION (city='Chicago')
- VALUES
भवान् द्रष्टुं शक्नोति यत् HDFS इत्यत्र त्रीणि निर्देशिकाः निर्मिताः सन्ति, ये त्रीणि विभाजनानि अनुरूपाः सन्ति select with where conditions to query इत्यस्य उपयोगेन प्रत्यक्षतया तत्सम्बद्धानां विभाजननिर्देशिकाभ्यः दत्तांशं प्राप्स्यति, तस्मात् प्रश्नेन स्कैन् कृतस्य दत्तांशस्य परिमाणं न्यूनीकरोति तथा च कार्यक्षमतां सुधरति
SELECT * FROM customer_data WHERE city='New York';
Hive इत्यस्मिन् अन्यः सारणीप्रकारः अस्ति, सारणीयां दत्तांशं हैश-बल्टीं कृत्वा, विशेषतः जॉइन् तथा एग्रीगेशन-क्रियाः कुर्वन्तः क्वेरी-प्रदर्शने अधिकं सुधारः कर्तुं शक्यते । बकेटिंग् सारणीः दत्तांशं नियतसङ्ख्यायां बाल्टीषु विभजन्ति, प्रत्येकं बकेट् पृथक् सञ्चिकायां संगृह्यते ।
----------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------- -लोटा मेजस्य लक्षणम्------------------------------------------------------------------------------------------------------------------------------------------------------------------ - ------- ९.
दत्तांशविभाजनम् : एकस्य वा अधिकस्य स्तम्भस्य हैशमूल्याधारितं नियतसङ्ख्यायां बाल्टीषु दत्तांशं वितरन्तु ।
सञ्चिकासञ्चयः : प्रत्येकस्य बाल्टीयाः दत्तांशः पृथक् सञ्चिकायां संगृहीतः भवति ।
एकरूपवितरणं : आदर्शरूपेण, दत्तांशः सर्वेषु बाल्टीषु समानरूपेण वितरितः भवति, अतः प्रश्नप्रदर्शने सुधारः भवति ।
- CREATE TABLE customer_data2 (
- customer_id STRING,
- name STRING,
- age INT,
- email STRING
- )
- CLUSTERED BY (customer_id) INTO 4 BUCKETS
- STORED AS ORC;
- -- 插入数据到分桶表
- --通过这些步骤,我们创建了一个按 customer_id 列进行分桶的 Hive 表 customer_data,并插入了具体的数据。
- INSERT INTO TABLE customer_data2 VALUES
-
- select *
- from customer_data2;
HDFS इत्यत्र मार्गं दृष्ट्वा वयं द्रष्टुं शक्नुमः यत् तत्सम्बद्धस्य स्तम्भस्य हैश-मूल्यानुसारं दत्तांशः भिन्न-भिन्न-बाल्टीषु विभक्तः भविष्यति ।