Обмен технологиями

Введение в основы сканера Python

2024-07-11

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina

шаг

  1. Получить веб-контент:

    1. HTTP-запрос

    2. Запрашивает библиотеку для Python

  2. Парсинг веб-контента

    1. HTML-структура веб-страницы

    2. Красивая библиотека Soup для Python

  3. Храните или анализируйте данные

    1. Хранить в базе данных

    2. Данные как анализ ИИ

    3. Преобразовать в график и отобразить

DDoS-атака

Отправка массовых высокочастотных запросов на сервер потребляет большое количество ресурсов веб-страницы и влияет на запросы других пользователей.

Следуй правилам

Вы можете просмотреть файл robots.txt веб-сайта, чтобы понять диапазон путей веб-страниц, которые можно сканировать.

HTTP (протокол передачи гипертекста)

  1. Протокол запроса-ответа между клиентом и сервером.

  2. Метод запроса: (обычно используется)

    1. ПОЛУЧИТЬ: Получить данные

    2. ПОСТ: Создание данных

  3. Запрос состоит из:
    POST /user/info HTTP/1.1           #请求行(包含方法类型、资源路径、协议版本)
    Host:www.example.com              #请求头
    User-Agent:curl/7.77.0            #请求头
    Accept:*/*                        #请求头
    
    {"username":"呦呦呦",              #请求体
    "email":"[email protected]"}      #请求头