Обмен технологиями

Сглаживание данных (часть)

2024-07-12

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina

       1. Скользящая средняя

Это самый простой метод сглаживания данных временных рядов. Он уменьшает шум, вычисляя среднее значение точек данных в определенном окне, сохраняя при этом тенденцию данных.пакет скользящих среднихВключает простую скользящую среднюю (SMA).или индексВзвешенная скользящая средняя (EMA).

        plt.rcParams['font.sans-serif'] = ['SimHei'],在整篇文章的代码中绘制图的时候加入此句代码,可以解决下图中文字标题显示不出的问题。

     1.1 Простая скользящая средняя (SMA)

Это метод сглаживания данных путем расчета среднего значения точек данных в фиксированном окне. Размер окна определяет степень сглаживания. Большее окно приведет к более плавной кривой, но замедлит реакцию на тенденции, тогда как меньшее окно будет более чувствительным к последующим колебаниям данных.

Понимание приведенного выше кода: синяя линейная диаграмма представляет массив, сгенерированный в коде. Как рассчитать простое скользящее среднее:

Изменения в окне изменят эффект сглаживания и степень сглаживания красным цветом. Когда размер окна равен 3, видно, что трудно сглаживаемая часть исчезла, а грубая кривая становится гладкой, но когда размер окна продолжает увеличиваться, наконец получается небольшая прямая линия. Красная кривая — это кривая прогнозирования.

Следует отметить, что при установке пакетов seaborn и matplotlib сложно установить их с помощью >python -m pip install matplotlib или pip install matplotlib https://pypi.tuna.tsinghua.edu.cn/simple или pin install matplotlib. В терминале появится следующее приглашение:

Невозможно распаковать файл C:UsersHONORAppDataLocalTemppip-unpack-4qkfflipsimple.html (скачанный с C:UsersHONORAppDataLocalTemppip-req-build-s6_3j05c, content-type: text/html); не удается определить формат архива
ОШИБКА: Невозможно определить формат архива C:UsersHONORAppDataLocalTemppip-req-build-s6_3j05c

Используйте следующий оператор для успешной установки:

pip install -i https://pypi.tuna.tsinghua.edu.cn/simple --trusted-host pypi.tuna.tsinghua.edu.cn matplotlib

pip install -i https://pypi.tuna.tsinghua.edu.cn/simple --trusted-host pypi.tuna.tsinghua.edu.cn seaborn

1.2 Экспоненциальное взвешенное скользящее среднее, EWMA

Экспоненциально взвешенное скользящее среднее — это метод сглаживания данных путем применения экспоненциальных весов к точкам данных.к этомуПоследние данные имеют больший вес, и дляБолее старым точкам данных придается меньший вес .Это делает EMA болееИдеально подходит для отслеживания быстрых измененийДанные.

Понимание кода экспоненциально взвешенного скользящего среднего: импортируйте соответствующий пакет, сгенерируйте соответствующий массив (например, синюю ломаную линию) и определите коэффициент сглаживания. Чем меньше коэффициент сглаживания, тем сильнее эффект сглаживания. наоборот. Так каков же алгоритм экспоненциально взвешенного скользящего среднего?

Взвешенное скользящее среднее периода t используется в качестве прогнозируемого значения периода t+1.

2. Экспоненциальное сглаживание

Экспоненциальное сглаживание — это широко используемый метод сглаживания и прогнозирования данных временных рядов для обработки данных с учетом тенденций и сезонности. Он фиксирует изменяющиеся тенденции данных, присваивая разные веса историческим точкам данных и присваивая более высокие веса новым данным. Экспоненциальное сглаживание часто используется для создания прогнозов, особенно когда прогнозы необходимо сделать на будущие моменты времени.

К основным особенностям экспоненциального сглаживания относятся:

  1. взвешенное сглаживание : Экспоненциальное сглаживание использует экспоненциальные веса для сглаживания данных. Новые точки данных получают более высокие веса, а более старые точки данных получают меньшие веса. Это означает, что он более чувствителен к последним данным и, следовательно, лучше фиксирует последние тенденции в данных.

  2. три основные формы : Существует три основных формы экспоненциального сглаживания: простое экспоненциальное сглаживание, двойное экспоненциальное сглаживание и тройное экспоненциальное сглаживание. Каждая форма используется для разных типов данных и шаблонов.

    • Простое экспоненциальное сглаживание используется для сглаживания данных с учетом тенденций и сезонности.

    • Двойное экспоненциальное сглаживание используется для сглаживания данных с учетом тенденций, но без сезонности.

    • Тройное экспоненциальное сглаживание используется для сглаживания данных, имеющих как тренд, так и сезонность.

  3. Рекурсивное обновление: Экспоненциальное сглаживание — это рекурсивный метод, который объединяет предыдущие сглаженные результаты с новыми точками данных для получения сглаженных результатов для следующего момента времени.

  4. Способность предсказывать : Экспоненциальное сглаживание используется не только для сглаживания данных, но также может использоваться для создания прогнозов на будущие моменты времени. Это делает его полезным в таких областях, как прогнозирование спроса, прогнозирование цен на акции и прогнозирование продаж.

  5. применимость: Экспоненциальное сглаживание подходит для стационарных и нестационарных данных временных рядов и хорошо справляется с тенденциями, сезонностью и шумом.

  6. случай:

Отображение результатов:

3. Полиномиальная аппроксимация

Полиномиальная аппроксимация — это метод сглаживания данных и подбора кривой, который использует полиномиальные функции для аппроксимации или аппроксимации исходных данных, чтобы лучше описать тенденцию или структуру данных. Цель полиномиальной аппроксимации — найти полиномиальную функцию, которая проходит по заданным точкам данных и хорошо соответствует этим точкам.

Общая форма полиномиальной аппроксимации следующая:

Среди них независимая переменная, зависимая переменная, зависящая от, и коэффициент полинома. Регулируя эти коэффициенты, вы можете улучшить соответствие полиномиальной функции данным.

Полиномиальная аппроксимация часто используется в следующих ситуациях:

  1. сглаживание данных: полиномиальную аппроксимацию можно использовать для удаления шума или колебаний данных и получения плавной кривой.

  2. анализ тенденций: полиномиальные аппроксимации можно использовать для выявления тенденций в данных, таких как линейные тенденции (полиномы первого порядка), квадратичные тенденции (полиномы второго порядка) или тенденции более высокого порядка.

  3. Кривая фитинга: Полиномиальную аппроксимацию можно использовать для аппроксимации экспериментальных данных с целью наилучшего соответствия теоретической модели или теоретической кривой.

  4. Интерполяция данных:Полиномиальная интерполяция — это частный случай полиномиальной аппроксимации, при которой промежуточные значения оцениваются с использованием полиномов между известными точками данных.

Общий принцип полиномиальной аппроксимации заключается в выборе соответствующего порядка полинома. Слишком низкий порядок может не соответствовать данным, а слишком высокий порядок может привести к переобучению, которое очень чувствительно к колебаниям новых данных. Поэтому выбор соответствующего порядка полинома является ключевым моментом. Трехчленный случай: