Compartir tecnología

Suavizado de datos (parte)

2024-07-12

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina

       1. Media móvil

Es el método de suavizado de datos más simple para suavizar datos de series temporales. Reduce el ruido calculando el promedio de los puntos de datos dentro de una ventana determinada y al mismo tiempo preserva la tendencia de los datos.paquete de media móvilIncluye media móvil simple (SMA)o índiceMedia Móvil Ponderada (EMA).

        plt.rcParams['font.sans-serif'] = ['SimHei'],在整篇文章的代码中绘制图的时候加入此句代码,可以解决下图中文字标题显示不出的问题。

     1.1 media móvil simple (SMA)

Es un método para suavizar datos calculando el promedio de puntos de datos dentro de una ventana fija. El tamaño de la ventana determina el grado de suavizado. Una ventana más grande dará como resultado una curva más suave pero ralentizará la respuesta a las tendencias, mientras que una ventana más pequeña será más sensible a las siguientes fluctuaciones en los datos.

Comprensión del código anterior: el gráfico de líneas azules representa la matriz generada en el código. Cómo calcular la media móvil simple:

Los cambios en la ventana cambiarán el efecto de suavizado y el grado de suavizado en rojo. Cuando el tamaño de la ventana es 3, se puede ver que la parte difícil de suavizar ha desaparecido y la curva rugosa se vuelve suave, pero cuando el tamaño de la ventana continúa aumentando, finalmente se obtiene una pequeña línea recta. La curva roja es la curva de predicción.

Cabe señalar que al instalar los paquetes seaborn y matplotlib, es difícil instalar usando >python -m pip install matplotlib o pip install matplotlib https://pypi.tuna.tsinghua.edu.cn/simple o pin install matplotlib. Aparece el siguiente mensaje en la terminal:

No se puede descomprimir el archivo C:UsersHONORAppDataLocalTemppip-unpack-4qkfflipsimple.html (descargado desde C:UsersHONORAppDataLocalTemppip-req-build-s6_3j05c, content-type: text/html); no se puede detectar el formato del archivo
ERROR: No se puede determinar el formato del archivo C:UsersHONORAppDataLocalTemppip-req-build-s6_3j05c

Utilice la siguiente declaración para instalar correctamente:

pip install -i https://pypi.tuna.tsinghua.edu.cn/simple --trusted-host pypi.tuna.tsinghua.edu.cn matplotlib

pip install -i https://pypi.tuna.tsinghua.edu.cn/simple --trusted-host pypi.tuna.tsinghua.edu.cn

1.2 Media móvil ponderada exponencial, EWMA

Una media móvil ponderada exponencialmente es un método para suavizar datos aplicando ponderaciones exponenciales a los puntos de datos.loLos puntos de datos recientes reciben mayor peso, y paraLos puntos de datos más antiguos reciben menos peso .Esto hace que la EMA sea másIdeal para rastrear cambios rápidosLos datos.

Comprensión del código de media móvil ponderada exponencialmente: importe el paquete correspondiente, genere la matriz correspondiente (es decir, la polilínea azul) y defina el factor de suavizado. Cuando el factor de suavizado es menor, el efecto de suavizado es más fuerte. viceversa. Entonces, ¿cuál es el algoritmo de media móvil ponderada exponencialmente?

La media móvil ponderada del período t se utiliza como valor previsto del período t+1.

2. Suavizado exponencial

El suavizado exponencial es un método de pronóstico y suavizado de datos de series temporales comúnmente utilizado para procesar datos con tendencias y estacionalidad. Capta las tendencias cambiantes de los datos asignando diferentes ponderaciones a los puntos de datos históricos y asignando ponderaciones más altas a los datos más nuevos. El suavizado exponencial se utiliza a menudo para generar pronósticos, especialmente cuando es necesario realizar pronósticos para momentos futuros.

Las principales características del suavizado exponencial incluyen:

  1. suavizado ponderado : El suavizado exponencial utiliza pesos exponenciales para suavizar los datos. Los puntos de datos más nuevos reciben ponderaciones más altas, mientras que los puntos de datos más antiguos reciben ponderaciones más bajas. Esto significa que es más sensible a los datos recientes, por lo que captura mejor las últimas tendencias en los datos.

  2. tres formas principales : Hay tres formas principales de suavizamiento exponencial: suavizamiento exponencial simple, suavizamiento exponencial doble y suavizamiento exponencial triple. Cada formulario se utiliza para diferentes tipos de datos y patrones.

    • El suavizado exponencial simple se utiliza para suavizar datos con tendencias y estacionalidad.

    • El suavizado exponencial doble se utiliza para suavizar datos con tendencias pero sin estacionalidad.

    • El suavizado triple exponencial se utiliza para suavizar datos que tienen tendencia y estacionalidad.

  3. actualización recursiva: El suavizado exponencial es un método recursivo que combina resultados suavizados anteriores con nuevos puntos de datos para producir resultados suavizados para el siguiente momento.

  4. Capacidad de predecir : El suavizado exponencial no solo se utiliza para suavizar datos, sino que también se puede utilizar para generar pronósticos para puntos temporales futuros. Esto lo hace útil en áreas como la previsión de la demanda, la previsión del precio de las acciones y la previsión de ventas.

  5. aplicabilidad: El suavizado exponencial es adecuado para datos de series temporales estacionarias o no estacionarias y puede manejar bien las tendencias, la estacionalidad y el ruido.

  6. caso:

Visualización de resultados:

3. Ajuste polinomial

El ajuste polinomial es un método de ajuste de curvas y suavizado de datos que utiliza funciones polinómicas para aproximar o ajustar los datos originales con el fin de describir mejor la tendencia o el patrón de los datos. El objetivo del ajuste polinómico es encontrar una función polinómica que pase por los puntos de datos dados y se ajuste bien a esos puntos.

La forma general de ajuste polinómico es la siguiente:

Entre ellas, se encuentra la variable independiente, la variable dependiente de la que depende y el coeficiente polinómico. Al ajustar estos coeficientes, puede hacer que la función polinómica se ajuste mejor a los datos.

El ajuste polinomial se utiliza a menudo en las siguientes situaciones:

  1. suavizado de datos: El ajuste polinomial se puede utilizar para eliminar ruido o fluctuaciones en los datos para obtener una curva suave.

  2. análisis de tendencia: Los ajustes polinomiales se pueden utilizar para identificar tendencias en sus datos, como tendencias lineales (polinomios de primer orden), tendencias cuadráticas (polinomios de segundo orden) o tendencias de orden superior.

  3. Ajuste de curvas: El ajuste polinomial se puede utilizar para ajustar datos experimentales y obtener el mejor ajuste a un modelo teórico o curva teórica.

  4. Interpolación de datos:La interpolación polinomial es un caso especial de ajuste polinómico, que estima valores intermedios utilizando polinomios entre puntos de datos conocidos.

El principio general del ajuste polinomial es elegir el orden polinomial apropiado. Un orden demasiado bajo puede no ajustarse bien a los datos, mientras que un orden demasiado alto puede dar lugar a un sobreajuste que es muy sensible a las fluctuaciones de los datos nuevos. Por tanto, elegir el orden polinómico adecuado es clave. Caso trinomio: