Compartilhamento de tecnologia

Automação Python Selenium sem login (cookie e token)

2024-07-12

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina

Índice

Login sem cookies

Obtenha cookies através da interface

Habilitar login para ignorar o navegador

adicionar token


O uso do login pode reduzir as operações repetidas de cada login, operar diretamente a página do menu após o login e também pode reduzir o login de verificação de segurança, como operações de login de verificação de imagem. Nota: Cookies e tokens têm datas de validade.

Login sem cookies

Obtenha cookies diretamente das ferramentas do desenvolvedor e adicione-os. A imagem abaixo mostra os cookies de vários sites na página web.

  1. from selenium import webdriver
  2. from selenium.webdriver.edge.options import Options
  3. # 一般只需要name和value
  4. cookie = {'name': 'ZY44', 'value': 'tLonhTkz50iHzxjhIsaaaafferr:C'}
  5. options = Options()
  6. # options.add_argument('--headless')
  7. wd = webdriver.Edge(options=options)
  8. wd.add_cookie(cookie_dict=cookie)
  9. #for c in cookies: # 如果是多个cookie要添加,cookies存储为列表是,使用循环添加
  10. # wd.add_cookie(c)
  11. wd.refresh() # 刷新页面
  12. wd.get(URL)
  13. wd.quit()

levantar exception_class(mensagem, tela, rastreamento de pilha)
selenium.common.exceptions.InvalidCookieDomainException: Mensagem: domínio de cookie inválido
(Informações da sessão: MicrosoftEdge=126.0.2592.87)

Se você receber o erro acima, poderá adicionar uma linha de wd.get(URL) antes de wd.add_cookie(cookie_dict=cookie), como segue:

  1. wd.get(URL)
  2. wd.add_cookie(cookie_dict=cookie)
  3. wd.get(URL)

Obtenha cookies através da interface

Após obter os dados do cookie por meio da interface, adicione o uso do cookie no Selenium

  1. def get_cookies():
  2. headers = {
  3. 'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/126.0.0.0 Safari/537.36',
  4. }
  5. host = 'https://baike.baidu.com'
  6. req = requests.get(host, headers=headers)
  7. cookie_data = req.cookies.get_dict()
  8. cookies = []
  9. for key, value in cookie_data.items():
  10. cookies.append(dict(name=key, value=value))
  11. return cookies

Habilitar login para ignorar o navegador

Entre no Google ou no navegador Edge:chrome://version/   或  edge://version/ 查看配置文件夹路径,Remova o padrão no final e adicione --user-data-dir= antes do caminho para unir o caminho que desejamos.

profile_directory = r'--user-data-dir=C:UsersxxxAppDataLocalMicrosoftEdgeUser Data'

  1. # 这里使用模糊匹配,把edge开头的进程都杀掉
  2. if platform.system() == "Windows":
  3. os.system("taskkill -im msedge* -f")
  4. else:
  5. os.system("killall -9 msedge*")
  6. user_data = r'C:UsersxxxAppDataLocalMicrosoftEdgeUser Data'
  7. profile_directory = rf'--user-data-dir={user_data}'
  8. options = Options()
  9. # options.add_argument('--headless')
  10. options.add_argument(profile_directory)
  11. wd = webdriver.Edge(options=options)
  12. wd.maximize_window()
  13. wd.get(URL)
  14. wd.quit()

Nota: Ao usar este método, você precisa fechar o programa do navegador correspondente, caso contrário, um erro será relatado, então você precisa encerrar o processo do navegador correspondente antes da execução. O código acima usa consulta de correspondência difusa para encerrar o processo, e o código a seguir é a correspondência completa.

  1. returnCode=os.system('taskkill /F /iM chrome.exe') # 谷歌
  2. returnCode=os.system('taskkill /F /iM iexplore.exe') # IE
  3. returnCode=os.system('taskkill /F /iM firefox.exe') # 火狐
  4. returnCode=os.system('taskkill /F /iM msedge.exe') # edge
  5. assert returnCode==0 #判断浏览器进程是否杀完

adicionar token

  1. token = "my_token"
  2. options = Options()
  3. options.add_argument('--headless')
  4. wd = webdriver.Edge(options=options)
  5. wd.execute_script("window.localStorage.setItem('token', '%s');" % token) # 使用selenium执行js的操作添加token
  6. wd.maximize_window()
  7. wd.get(url)
  8. wd.quit()