τα στοιχεία επικοινωνίας μου
Ταχυδρομείο[email protected]
2024-07-12
한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina
Η βιβλιοθήκη αιτημάτων της Python είναι μια ισχυρή και εύχρηστη βιβλιοθήκη HTTP για την αποστολή αιτημάτων HTTP και την επεξεργασία των απαντήσεων. Είναι ένα από τα πιο δημοφιλή πλαίσια προγράμματος ανίχνευσης ιστού στην Python και χρησιμοποιείται ευρέως για την εξαγωγή δεδομένων από ιστοσελίδες, την ανίχνευση ιστοτόπων και την πραγματοποίηση κλήσεων API.
Χρησιμοποιώντας τη βιβλιοθήκη αιτημάτων, μπορείτε εύκολα να στείλετε διάφορα αιτήματα HTTP, όπως GET, POST, PUT, DELETE κ.λπ. Μπορείτε να δημιουργήσετε ένα αντικείμενο αιτήματος HTTP, να ορίσετε τις κεφαλίδες αιτήματος, το σώμα αιτήματος και άλλες παραμέτρους, στη συνέχεια να στείλετε το αίτημα και να λάβετε την απάντηση. Η βιβλιοθήκη αιτημάτων παρέχει πολλές βολικές μεθόδους για την επεξεργασία των απαντήσεων, συμπεριλαμβανομένης της λήψης περιεχομένου απόκρισης, της ανάλυσης JSON, της ανάλυσης HTML κ.λπ.
Εάν τα αιτήματα δεν είναι εγκατεστημένα στο τοπικό περιβάλλον Python, μπορείτε να εισαγάγετε την εντολή στο παράθυρο της γραμμής εντολών
pip install requests
Εγκατάσταση μονάδας αιτημάτων
Μπορούμε να ανοίξουμε μια ιστοσελίδα κατά βούληση, F12->"Ctrl+R" για ανανέωση, κάντε διπλό κλικ στο στοιχείο στο όνομα
Μπορείτε να δείτε το User-Agent και το Cookie
Ακολουθούν ορισμένες συνήθεις λειτουργίες και χρήση της βιβλιοθήκης αιτημάτων:
Στείλτε ένα αίτημα GET:
response = requests.get(url)
Αποστολή αιτήματος POST:
response = requests.post(url, data=payload)
Ορισμός κεφαλίδων αιτημάτων:
- headers = {'User-Agent': 'Mozilla/5.0'}
- response = requests.get(url, headers=headers)
Παράμετροι διέλευσης URL:
- params = {'key1': 'value1', 'key2': 'value2'}
- response = requests.get(url, params=params)
Αποστολή αρχείου:
- files = {'file': open('file.txt', 'rb')}
- response = requests.post(url, files=files)
Λάβετε το περιεχόμενο της απάντησης:
print(response.text)
Αναλύστε την απάντηση JSON:
json_data = response.json()
Αναλύστε την απάντηση HTML:
- from bs4 import BeautifulSoup
- soup = BeautifulSoup(response.text, 'html.parser')
Εξαιρέσεις χειρισμού:
- try:
- response = requests.get(url)
- response.raise_for_status()
- except requests.HTTPError as e:
- print('HTTPError:', e)
- except requests.ConnectionError as e:
- print('ConnectionError:', e)
- except requests.Timeout as e:
- print('Timeout:', e)
- except requests.RequestException as e:
- print('RequestException:', e)
Τα παραπάνω είναι μόνο ένα μικρό μέρος των λειτουργιών της βιβλιοθήκης αιτημάτων Παρέχει επίσης πολλές άλλες προηγμένες λειτουργίες και επιλογές, όπως διαχείριση περιόδων σύνδεσης, έλεγχος ταυτότητας, ρυθμίσεις διακομιστή μεσολάβησης, κ.λπ., οι οποίες μπορούν να σας βοηθήσουν να κάνετε ανίχνευση ιστού και κλήσεις API.
Ολοκληρώστε τη ρουτίνα λειτουργίας αιτήματος:
- import requests
-
-
- def get_html(url):
- '''
- 两个参数
- :param url:统一资源定位符,请求网址
- :param headers:请求头
- :return html 网页的源码
- :return sess 创建的会话
- '''
-
- # 请求头
- headers={'User-Agent': '复制了放这里'}
- # 创建Session, 并使用Session的get请求网页
- sess = requests.Session()
- response = sess.get(url=url,headers = headers)
- # 获取网页信息文本
- html = response.text
-
- return html, sess