Condivisione della tecnologia

Automazione Python Selenium senza login (cookie e token)

2024-07-12

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina

Sommario

Accesso senza cookie

Ottieni i cookie attraverso l'interfaccia

Abilita l'accesso tramite bypass del browser

aggiungi gettone


L'utilizzo dell'accesso può ridurre le operazioni ripetute di ogni accesso, gestire direttamente la pagina del menu dopo l'accesso e può anche ridurre l'accesso di verifica della sicurezza, come le operazioni di accesso di verifica dell'immagine. Nota: cookie e token hanno date di scadenza.

Accesso senza cookie

Ottieni i cookie direttamente dagli strumenti di sviluppo e aggiungili L'immagine seguente mostra i cookie di più siti sulla pagina web Basta selezionare quelli che ti servono e aggiungerli.

  1. from selenium import webdriver
  2. from selenium.webdriver.edge.options import Options
  3. # 一般只需要name和value
  4. cookie = {'name': 'ZY44', 'value': 'tLonhTkz50iHzxjhIsaaaafferr:C'}
  5. options = Options()
  6. # options.add_argument('--headless')
  7. wd = webdriver.Edge(options=options)
  8. wd.add_cookie(cookie_dict=cookie)
  9. #for c in cookies: # 如果是多个cookie要添加,cookies存储为列表是,使用循环添加
  10. # wd.add_cookie(c)
  11. wd.refresh() # 刷新页面
  12. wd.get(URL)
  13. wd.quit()

solleva exception_class(messaggio, schermo, stacktrace)
selenium.common.Exceptions.InvalidCookieDomainException: Messaggio: dominio cookie non valido
(Informazioni sulla sessione: MicrosoftEdge=126.0.2592.87)

Se ricevi l'errore precedente, puoi aggiungere una riga di wd.get(URL) prima di wd.add_cookie(cookie_dict=cookie), come segue:

  1. wd.get(URL)
  2. wd.add_cookie(cookie_dict=cookie)
  3. wd.get(URL)

Ottieni i cookie attraverso l'interfaccia

Dopo aver ottenuto i dati sui cookie tramite l'interfaccia, aggiungi l'utilizzo dei cookie in selenio

  1. def get_cookies():
  2. headers = {
  3. 'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/126.0.0.0 Safari/537.36',
  4. }
  5. host = 'https://baike.baidu.com'
  6. req = requests.get(host, headers=headers)
  7. cookie_data = req.cookies.get_dict()
  8. cookies = []
  9. for key, value in cookie_data.items():
  10. cookies.append(dict(name=key, value=value))
  11. return cookies

Abilita l'accesso tramite bypass del browser

Inserisci in Google o nel browser Edge:chrome://version/   或  edge://version/ 查看配置文件夹路径,Rimuovi il valore predefinito alla fine, quindi aggiungi --user-data-dir= prima del percorso per unire il percorso che desideriamo.

profile_directory = r'--user-data-dir=C:UsersxxxAppDataLocalMicrosoftEdgeUser Data'

  1. # 这里使用模糊匹配,把edge开头的进程都杀掉
  2. if platform.system() == "Windows":
  3. os.system("taskkill -im msedge* -f")
  4. else:
  5. os.system("killall -9 msedge*")
  6. user_data = r'C:UsersxxxAppDataLocalMicrosoftEdgeUser Data'
  7. profile_directory = rf'--user-data-dir={user_data}'
  8. options = Options()
  9. # options.add_argument('--headless')
  10. options.add_argument(profile_directory)
  11. wd = webdriver.Edge(options=options)
  12. wd.maximize_window()
  13. wd.get(URL)
  14. wd.quit()

Nota: quando si utilizza questo metodo, è necessario chiudere il programma del browser corrispondente, altrimenti verrà segnalato un errore, quindi è necessario terminare il processo del browser corrispondente prima dell'esecuzione. Il codice precedente utilizza query di corrispondenza fuzzy per terminare il processo e quello seguente è una corrispondenza completa.

  1. returnCode=os.system('taskkill /F /iM chrome.exe') # 谷歌
  2. returnCode=os.system('taskkill /F /iM iexplore.exe') # IE
  3. returnCode=os.system('taskkill /F /iM firefox.exe') # 火狐
  4. returnCode=os.system('taskkill /F /iM msedge.exe') # edge
  5. assert returnCode==0 #判断浏览器进程是否杀完

aggiungi gettone

  1. token = "my_token"
  2. options = Options()
  3. options.add_argument('--headless')
  4. wd = webdriver.Edge(options=options)
  5. wd.execute_script("window.localStorage.setItem('token', '%s');" % token) # 使用selenium执行js的操作添加token
  6. wd.maximize_window()
  7. wd.get(url)
  8. wd.quit()