2024-07-12
한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina
सामग्रीसूची
25. pandas.HDFStore.get कार्यम्
26. pandas.HDFStore.select कार्यम्
27. pandas.HDFStore.info कार्यम्
- # 25、pandas.HDFStore.get函数
- HDFStore.get(key)
- Retrieve pandas object stored in file.
-
- Parameters:
- key
- str
- Returns:
- object
- Same type as object stored in file.
25-2-1、कीलम्(अवश्यम्):एकः स्ट्रिंग् यः पुनः प्राप्तव्यस्य दत्तांशस्य HDF5 सञ्चिकायां स्थानं वा नाम वा निर्दिशति यत् एतत् कुञ्जी प्रायः भवता HDF5 सञ्चिकायां दत्तांशं रक्षन् प्रयुक्तस्य नामस्य वा मार्गस्य वा अनुरूपं भवति ।
HDF5 सञ्चिकाभ्यः संगृहीतदत्तांशं पुनः प्राप्तुं (अथवा प्राप्तुं) उपयुज्यते ।
सामान्यतया, एतत् कार्यं कीलसम्बद्धं पाण्डा-वस्तुं, यथा DataFrame, Series, अन्यत् सम्भाव्यं पाण्डा-पात्रं वा, प्रत्यागमिष्यति ।
विशेषतः, रिटर्न् मूल्यं भवितुम् अर्हति:
25-4-1、दत्तांशचक्रम् : यदि HDF5 सञ्चिकायां संगृहीतस्य कुञ्जिकायाः सह सम्बद्धः दत्तांशः सारणी अथवा सारणी-सदृशः दत्तांशसंरचना अस्ति तर्हि get मेथड् DataFrame ऑब्जेक्ट् प्रत्यागमिष्यति । DataFrame संरचितदत्तांशस्य संग्रहणार्थं, परिवर्तनार्थं च पाण्डासु मुख्या आँकडासंरचना अस्ति, एतत् सारणीबद्धरूपेण आँकडानां संग्रहणं करोति, यत्र पङ्क्तयः स्तम्भाः च सन्ति ।
25-4-2、श्रृङ्खला: केषुचित् सन्दर्भेषु, यदि संगृहीतदत्तांशः एक-आयामी अस्ति, यथा समय-श्रृङ्खला-दत्तांशः अथवा एकस्य स्तम्भस्य दत्तांशः, तर्हि get-विधिः एक-आयामी-दत्तांशस्य संग्रहणार्थं पाण्डासु Series-वस्तुं प्रेषयितुं शक्नोति (अर्थात्, with indexes array) दत्तांशसंरचना।
25-4-3 अन्ये पाण्डा विषयाः : यद्यपि न्यूनसामान्यम्, HDF5 सञ्चिकाः सैद्धान्तिकरूपेण अन्यप्रकारस्य पाण्डा-वस्तूनाम् संग्रहीतुं शक्नुवन्ति, यथा Panels (टिप्पणी: pandas संस्करण 0.25.0 तः आरभ्य, Panel अप्रचलितं कृत्वा pandas पुस्तकालयात् निष्कासितम् अस्ति) परन्तु यथा यथा पाण्डानां विकासः जातः तथा तथा एषा स्थितिः अधिकाधिकं दुर्लभा अभवत् ।
25-4-4, न कश्चित् पूर्वनिर्धारितमूल्यं वा : यदि निर्दिष्टं कुञ्जी HDF5 सञ्चिकायां नास्ति तथा च get मेथड् द्वितीयपैरामीटर् रूपेण पूर्वनिर्धारितं मूल्यं न ददाति, तर्हि KeyError उत्थापयितुं शक्नोति । तथापि, यदि पूर्वनिर्धारितं मूल्यं प्रदत्तं भवति (यद्यपि get मेथड् कृते एषः मानकव्यवहारः नास्ति, यतः get मेथड् सामान्यतया HDFStore मध्ये पूर्वनिर्धारितमूल्यमापदण्डान् प्रत्यक्षतया समर्थयति न), तर्हि DataFrame कृते एतत् भवितुं शक्नोति।प्राप्नोतु obfuscation of the method), ततः तत् पूर्वनिर्धारितं मूल्यं प्रत्यागमिष्यति । तथापि HDFStore इत्यस्य सन्दर्भे KeyError इत्यस्य ग्रहणार्थं आवश्यकतानुसारं प्रकरणं नियन्त्रयितुं च try-except block इत्यस्य उपयोगः अधिकं सामान्यम् अस्ति ।
न कश्चित्
无
- # 25、pandas.HDFStore.get函数
- import pandas as pd
- # 创建一个示例的DataFrame
- data = pd.DataFrame({
- 'A': [1, 2, 3, 4],
- 'B': ['foo', 'bar', 'foo', 'bar'],
- 'C': [0.1, 0.2, 0.3, 0.4]
- })
- # 将数据保存到HDF5文件中
- filename = 'example.h5'
- key = 'data'
- data.to_hdf(filename, key=key, format='table', mode='w')
- # 从HDF5文件中读取数据
- with pd.HDFStore(filename, mode='r') as store:
- df_from_hdf = store.get(key)
- # 打印读取的数据
- print("Data read from HDF5:")
- print(df_from_hdf)
- # 25、pandas.HDFStore.get函数
- # Data read from HDF5:
- # A B C
- # 0 1 foo 0.1
- # 1 2 bar 0.2
- # 2 3 foo 0.3
- # 3 4 bar 0.4
- # 26、pandas.HDFStore.select函数
- HDFStore.select(key, where=None, start=None, stop=None, columns=None, iterator=False, chunksize=None, auto_close=False)
- Retrieve pandas object stored in file, optionally based on where criteria.
-
- Warning
-
- Pandas uses PyTables for reading and writing HDF5 files, which allows serializing object-dtype data with pickle when using the “fixed” format. Loading pickled data received from untrusted sources can be unsafe.
-
- See: https://docs.python.org/3/library/pickle.html for more.
-
- Parameters:
- key
- str
- Object being retrieved from file.
-
- where
- list or None
- List of Term (or convertible) objects, optional.
-
- start
- int or None
- Row number to start selection.
-
- stop
- int, default None
- Row number to stop selection.
-
- columns
- list or None
- A list of columns that if not None, will limit the return columns.
-
- iterator
- bool or False
- Returns an iterator.
-
- chunksize
- int or None
- Number or rows to include in iteration, return an iterator.
-
- auto_close
- bool or False
- Should automatically close the store when finished.
-
- Returns:
- object
- Retrieved object from file.
26-2-1、कीलम्(अवश्यम्):HDF5 सञ्चिकायां कुञ्जी (अथवा मार्गः) पुनः प्राप्तुं, एतत् प्रायः HDF5 सञ्चिकायां आँकडानां रक्षणसमये निर्दिष्टं नाम वा मार्गः वा भवति ।
26-2-2、कुत्र(वैकल्पिकं, पूर्वनिर्धारितं मूल्यं None अस्ति): दत्तांशस्य छाननाय प्रयुक्तः सशर्तव्यञ्जनः । यदि एतत् स्ट्रिंग् अस्ति, तर्हि एतत् वैधं Pandas query स्ट्रिंग् भवितुमर्हति, यत् DataFrame इत्यत्र .query() मेथड् इत्यस्य उपयोगं कुर्वन् उपयुज्यमानस्य सदृशं यदि इदं कॉलेबल ऑब्जेक्ट् (यथा फंक्शन्) अस्ति, तर्हि एतत् Accepts a DataFrame भवितुमर्हति input इत्यस्य रूपेण च बूलियन-अनुक्रमं प्रत्यागच्छति यत् काः पङ्क्तयः चयनिताः भवेयुः इति सूचयति ।
26-2-3、आरम्भ/विराम(वैकल्पिकं, पूर्वनिर्धारितं मूल्यं None अस्ति):पुनः प्राप्तव्यानां पङ्क्तयः आरम्भ/समाप्तिसूचकाङ्कः (0-आधारितः यदि आरम्भः स्थगितश्च निर्दिष्टौ स्तः तर्हि एतयोः अनुक्रमणिकायोः मध्ये पङ्क्तयः एव पुनः प्राप्ताः भविष्यन्ति (प्रारम्भः सहितः, परन्तु स्थगितत्वं न समाविष्टम्) ।
26-2-4、स्तम्भाः(वैकल्पिकं, पूर्वनिर्धारितं मूल्यं None अस्ति):स्तम्भनामानां सूची अथवा पुनः प्राप्तुं एकस्तम्भनाम यदि एषः पैरामीटर् निर्दिष्टः अस्ति तर्हि एतेषां स्तम्भानां कृते केवलं दत्तांशः पुनः प्राप्तः भविष्यति ।
26-2-5、पुनरावृत्तिः(वैकल्पिकं, पूर्वनिर्धारितं मूल्यं False अस्ति):यदि True, तर्हि एकं पुनरावर्तकं प्रत्यागच्छति यत् सम्पूर्णं दत्तांशसमूहं एकदा एव स्मृतौ लोड् कर्तुं न अपितु खण्डेन दत्तांशखण्डं जनयति, यत् बृहत्दत्तांशसमूहानां संसाधनार्थं उपयोगी भवति
26-2-6、चुंकसिज़्(वैकल्पिकं, पूर्वनिर्धारितं मूल्यं None अस्ति):यदा iterator=True, तदा एषः पैरामीटर् प्रत्येकस्मिन् खण्डे पङ्क्तिसङ्ख्यां निर्दिशति, यत् भवन्तं स्मृतिप्रयोगं नियन्त्रयितुं शक्नोति तथा च बृहत्दत्तांशसमूहानां संसाधने कार्यक्षमतां सुधारयितुं शक्नोति ।
26-2-7、स्वतः_निमीलनम्(वैकल्पिकं, पूर्वनिर्धारितं मूल्यं False अस्ति): यदि True तर्हि पुनरावर्तकः क्षीणः भवति अथवा अपवादः भवति तदा भण्डारणं स्वयमेव बन्दं भवति, यत् त्रुटिः भवति चेदपि सञ्चिका सम्यक् बन्दं भवति इति सुनिश्चित्य सहायकं भवति तथापि कृपया ज्ञातव्यं यत् यदि भवान् पुनरावर्तकस्य समाप्तेः अनन्तरं HDFStore ऑब्जेक्ट्स् इत्यस्य उपयोगं निरन्तरं कर्तुं योजनां करोति तर्हि भवान् एतत् पैरामीटर् False इति सेट् कर्तव्यम् ।
HDF5 सञ्चिकातः विशिष्टकुंजी-अन्तर्गतं संगृहीतं पाण्डा-वस्तूनाम् (यथा DataFrame अथवा Series) पुनः प्राप्तुं तथा च उपयोक्तारं पैरामीटर्-श्रृङ्खलायाः आधारेण पुनः प्राप्तं दत्तांशं छानयितुं वा नियन्त्रयितुं वा अनुमतिं ददातु
रिटर्न् वैल्यू HDF5 सञ्चिकायां संगृहीतेन कीलेन सह सम्बद्धस्य दत्तांशप्रकारस्य तथा प्रश्नस्य स्थितिषु (यदि सन्ति) निर्भरं भवति । सामान्यतया, रिटर्न् वैल्यू एकं पाण्डस् ऑब्जेक्ट् भवति, यथा:
26-4-1、दत्तांशचक्रम्: यदि पुनः प्राप्तः दत्तांशः सारणीरूपेण अस्ति तर्हि DataFrame वस्तु प्रत्यागमिष्यति ।
26-4-2、श्रृङ्खला: यदि पुनः प्राप्तः दत्तांशः एक-आयामी अस्ति (उदाहरणार्थं, एकस्य स्तम्भस्य कृते दत्तांशः), तर्हि Series-वस्तु प्रत्यागन्तुं शक्यते, यद्यपि एतत् प्रायः तदा भवति यदा एकः स्तम्भः स्पष्टतया स्तम्भ-मापदण्डरूपेण निर्दिष्टः भवति
26-4-3 अन्ये पाण्डा विषयाः: सिद्धान्ततः अन्ये पाण्डापात्राणि अपि भवितुम् अर्हन्ति, परन्तु HDF5 सञ्चिकानां सन्दर्भे सर्वाधिकं सामान्यानि DataFrame तथा Series सन्ति ।
न कश्चित्
无
- # 26、pandas.HDFStore.select函数
- import pandas as pd
- import numpy as np
- # 创建一个示例DataFrame
- np.random.seed(0) # 设置随机种子以确保结果可重复
- data = pd.DataFrame({
- 'A': np.random.randn(100),
- 'B': np.random.randn(100),
- 'C': np.random.randn(100),
- 'D': np.random.randint(0, 2, 100)
- })
- # 将DataFrame保存到HDF5文件中
- with pd.HDFStore('example.h5') as store:
- store.put('data', data, format='table')
- # 从HDF5文件中检索数据的示例
- with pd.HDFStore('example.h5') as store:
- # 选择所有数据
- print("nAll data:")
- all_data = store.select('data')
- print(all_data.head()) # 只打印前几行以节省空间
- # 选择特定的列
- print("nSpecific columns (A, B):")
- specific_columns = store.select('data', columns=['A', 'B'])
- print(specific_columns.head())
- # 选择部分数据行(注意:HDF5的索引可能不是从0开始的,但这里假设它是)
- print("nPartial data (rows 10 to 19):")
- partial_data = store.select('data', start=10, stop=20)
- print(partial_data)
- # 使用chunksize来逐块读取数据
- print("nData read in chunks:")
- chunks = store.select('data', chunksize=10)
- for i, chunk in enumerate(chunks):
- print(f"Chunk {i + 1}:")
- print(chunk.head()) # 只打印每个块的前几行
- # 26、pandas.HDFStore.select函数
- # All data:
- # A B C D
- # 0 1.764052 1.883151 -0.369182 0
- # 1 0.400157 -1.347759 -0.239379 0
- # 2 0.978738 -1.270485 1.099660 1
- # 3 2.240893 0.969397 0.655264 1
- # 4 1.867558 -1.173123 0.640132 0
- #
- # Specific columns (A, B):
- # A B
- # 0 1.764052 1.883151
- # 1 0.400157 -1.347759
- # 2 0.978738 -1.270485
- # 3 2.240893 0.969397
- # 4 1.867558 -1.173123
- #
- # Partial data (rows 10 to 19):
- # A B C D
- # 10 0.144044 1.867559 0.910179 0
- # 11 1.454274 0.906045 0.317218 0
- # 12 0.761038 -0.861226 0.786328 1
- # 13 0.121675 1.910065 -0.466419 0
- # 14 0.443863 -0.268003 -0.944446 0
- # 15 0.333674 0.802456 -0.410050 0
- # 16 1.494079 0.947252 -0.017020 1
- # 17 -0.205158 -0.155010 0.379152 1
- # 18 0.313068 0.614079 2.259309 0
- # 19 -0.854096 0.922207 -0.042257 0
- #
- # Data read in chunks:
- # Chunk 1:
- # A B C D
- # 0 1.764052 1.883151 -0.369182 0
- # 1 0.400157 -1.347759 -0.239379 0
- # 2 0.978738 -1.270485 1.099660 1
- # 3 2.240893 0.969397 0.655264 1
- # 4 1.867558 -1.173123 0.640132 0
- # Chunk 2:
- # A B C D
- # 10 0.144044 1.867559 0.910179 0
- # 11 1.454274 0.906045 0.317218 0
- # 12 0.761038 -0.861226 0.786328 1
- # 13 0.121675 1.910065 -0.466419 0
- # 14 0.443863 -0.268003 -0.944446 0
- # Chunk 3:
- # A B C D
- # 20 -2.552990 0.376426 -0.955945 0
- # 21 0.653619 -1.099401 -0.345982 1
- # 22 0.864436 0.298238 -0.463596 0
- # 23 -0.742165 1.326386 0.481481 0
- # 24 2.269755 -0.694568 -1.540797 1
- # Chunk 4:
- # A B C D
- # 30 0.154947 -0.769916 -1.424061 1
- # 31 0.378163 0.539249 -0.493320 0
- # 32 -0.887786 -0.674333 -0.542861 0
- # 33 -1.980796 0.031831 0.416050 1
- # 34 -0.347912 -0.635846 -1.156182 1
- # Chunk 5:
- # A B C D
- # 40 -1.048553 -1.491258 -0.637437 0
- # 41 -1.420018 0.439392 -0.397272 1
- # 42 -1.706270 0.166673 -0.132881 0
- # 43 1.950775 0.635031 -0.297791 0
- # 44 -0.509652 2.383145 -0.309013 0
- # Chunk 6:
- # A B C D
- # 50 -0.895467 -0.068242 0.521065 1
- # 51 0.386902 1.713343 -0.575788 1
- # 52 -0.510805 -0.744755 0.141953 0
- # 53 -1.180632 -0.826439 -0.319328 0
- # 54 -0.028182 -0.098453 0.691539 1
- # Chunk 7:
- # A B C D
- # 60 -0.672460 -0.498032 -1.188859 1
- # 61 -0.359553 1.929532 -0.506816 1
- # 62 -0.813146 0.949421 -0.596314 0
- # 63 -1.726283 0.087551 -0.052567 0
- # 64 0.177426 -1.225436 -1.936280 0
- # Chunk 8:
- # A B C D
- # 70 0.729091 0.920859 0.399046 0
- # 71 0.128983 0.318728 -2.772593 1
- # 72 1.139401 0.856831 1.955912 0
- # 73 -1.234826 -0.651026 0.390093 1
- # 74 0.402342 -1.034243 -0.652409 1
- # Chunk 9:
- # A B C D
- # 80 -1.165150 -0.353994 -0.110541 0
- # 81 0.900826 -1.374951 1.020173 0
- # 82 0.465662 -0.643618 -0.692050 1
- # 83 -1.536244 -2.223403 1.536377 0
- # 84 1.488252 0.625231 0.286344 0
- # Chunk 10:
- # A B C D
- # 90 -0.403177 -1.292857 -0.628088 1
- # 91 1.222445 0.267051 -0.481027 1
- # 92 0.208275 -0.039283 2.303917 0
- # 93 0.976639 -1.168093 -1.060016 1
- # 94 0.356366 0.523277 -0.135950 0
- # 27、pandas.HDFStore.info函数
- HDFStore.info()
- Print detailed information on the store.
-
- Returns:
- str
न कश्चित्
HDF5 सञ्चिकासु संगृहीतदत्तांशसमूहानां (कीज अथवा नोड् इति अपि उच्यते) विषये विस्तृतसूचनाः प्रदाति ।
प्रत्यक्षं प्रत्यागमनमूल्यं नास्ति (अर्थात् चरं प्रति कोऽपि दत्तांशः न प्रत्यागच्छति), परन्तु सूचना कन्सोल् (अथवा मानकनिर्गम) प्रति मुद्रिता भवति ।
न कश्चित्
无
- # 27、pandas.HDFStore.info函数
- import pandas as pd
- import numpy as np
- # 创建一个包含随机数的数据帧
- data = pd.DataFrame({
- 'A': np.random.randn(100),
- 'B': np.random.randn(100),
- 'C': np.random.randn(100),
- 'D': np.random.randint(0, 2, 100)
- })
- # 将数据写入HDF5文件
- with pd.HDFStore('example.h5') as store:
- store.put('data', data, format='table')
- # 使用HDFStore.info()函数获取HDF5文件的信息
- with pd.HDFStore('example.h5') as store:
- # 打印存储的信息
- store.info()
- # 读取数据以确认
- all_data = store.select('data')
- print("nAll data (first 5 rows):")
- print(all_data.head())
- # 27、pandas.HDFStore.info函数
- # All data (first 5 rows):
- # A B C D
- # 0 -1.186803 -0.983345 0.661022 1
- # 1 0.549244 -0.429500 -0.022329 1
- # 2 1.408989 0.779268 0.079574 1
- # 3 -1.178696 0.918125 0.174332 0
- # 4 -0.538677 -0.124535 -1.165208 1