Lissage des données (partie)

2024-07-12

1. Moyenne mobile

Il s'agit de la méthode de lissage des données la plus simple pour lisser les données de séries chronologiques. Il réduit le bruit en calculant la moyenne des points de données dans une certaine fenêtre tout en préservant la tendance des données.forfait moyenne mobileComprend la moyenne mobile simple (SMA)ou indexMoyenne mobile pondérée (EMA).

        plt.rcParams['font.sans-serif'] = ['SimHei']，在整篇文章的代码中绘制图的时候加入此句代码，可以解决下图中文字标题显示不出的问题。

1.1 Moyenne mobile simple (SMA)：

Il s'agit d'une méthode de lissage des données en calculant la moyenne des points de données dans une fenêtre fixe. La taille de la fenêtre détermine le degré de lissage. Une fenêtre plus grande entraînera une courbe plus lisse mais ralentira la réponse aux tendances, tandis qu'une fenêtre plus petite sera plus sensible au suivi des fluctuations des données.

Compréhension du code ci-dessus : Le graphique en courbes bleues représente le tableau généré dans le code. Comment calculer une moyenne mobile simple :

Les modifications dans la fenêtre modifieront l'effet de lissage et le degré de lissage en rouge. Lorsque la taille de la fenêtre est de 3, on peut voir que la partie difficile à lisser a disparu et la courbe rugueuse devient lisse. Cependant, lorsque la taille de la fenêtre continue d'augmenter, une petite ligne droite est finalement obtenue. La courbe rouge est la courbe de prédiction.

Il convient de noter que lors de l'installation des packages seaborn et matplotlib, il est difficile d'installer en utilisant >python -m pip install matplotlib ou pip install matplotlib https://pypi.tuna.tsinghua.edu.cn/simple ou pin install matplotlib. L'invite suivante apparaît dans le terminal :

Impossible de décompresser le fichier C:UsersHONORAppDataLocalTemppip-unpack-4qkfflipsimple.html (téléchargé depuis C:UsersHONORAppDataLocalTemppip-req-build-s6_3j05c, type de contenu : text/html) ; impossible de détecter le format d'archive
ERREUR : Impossible de déterminer le format d'archive de C:UsersHONORAppDataLocalTemppip-req-build-s6_3j05c

Utilisez l'instruction suivante pour réussir l'installation :

pip install -i https://pypi.tuna.tsinghua.edu.cn/simple --trusted-host pypi.tuna.tsinghua.edu.cn matplotlib

pip install -i https://pypi.tuna.tsinghua.edu.cn/simple --trusted-host pypi.tuna.tsinghua.edu.cn

1.2 Moyenne mobile pondérée exponentielle, EWMA：

La moyenne mobile à pondération exponentielle est une méthode de lissage des données en appliquant des pondérations exponentielles aux points de données.à celaLes points de données récents reçoivent un poids plus élevé, et pourLes points de données plus anciens reçoivent un poids moindre .Cela rend l'EMA plusIdéal pour suivre les changements rapidesLes données.

Compréhension du code de moyenne mobile pondérée exponentiellement : importez le package correspondant, générez le tableau correspondant (c'est-à-dire la polyligne bleue) et définissez le facteur de lissage. Lorsque le facteur de lissage est plus petit, l'effet de lissage est plus fort. vice versa. Alors, quel est l’algorithme de moyenne mobile à pondération exponentielle ?

La moyenne mobile pondérée de la période t est utilisée comme valeur prédite de la période t+1.

2. Lissage exponentiel

Le lissage exponentiel est une méthode de lissage et de prévision des données de séries chronologiques couramment utilisée pour traiter les données avec des tendances et une saisonnalité. Il capture les tendances changeantes des données en attribuant des pondérations différentes aux points de données historiques et en attribuant des pondérations plus élevées aux données plus récentes. Le lissage exponentiel est souvent utilisé pour générer des prévisions, en particulier lorsque des prévisions doivent être faites pour des points temporels futurs.

Les principales caractéristiques du lissage exponentiel comprennent :

lissage pondéré : Le lissage exponentiel utilise des poids exponentiels pour lisser les données. Les points de données les plus récents reçoivent des pondérations plus élevées, tandis que les points de données plus anciens reçoivent des pondérations plus faibles. Cela signifie qu'il est plus sensible aux données récentes, capturant ainsi mieux les dernières tendances des données.
trois formes principales : Il existe trois formes principales de lissage exponentiel : le lissage exponentiel simple, le lissage exponentiel double et le lissage exponentiel triple. Chaque formulaire est utilisé pour différents types de données et de modèles.
- Le lissage exponentiel simple est utilisé pour lisser les données avec les tendances et la saisonnalité.
- Le double lissage exponentiel est utilisé pour lisser les données avec des tendances mais sans saisonnalité.
- Le lissage exponentiel triple est utilisé pour lisser les données présentant à la fois une tendance et une saisonnalité.
Mise à jour récursive: Le lissage exponentiel est une méthode récursive qui combine les résultats lissés précédents avec de nouveaux points de données pour produire des résultats lissés pour le moment suivant.
Capacité à prédire : Le lissage exponentiel n'est pas seulement utilisé pour lisser les données, mais peut également être utilisé pour générer des prévisions pour des points temporels futurs. Cela le rend utile dans des domaines tels que la prévision de la demande, la prévision du cours des actions et la prévision des ventes.
applicabilité: Le lissage exponentiel convient aux données de séries chronologiques stationnaires ou non stationnaires et peut bien gérer les tendances, la saisonnalité et le bruit.
cas:

Affichage des résultats :

3. Ajustement polynomial

L'ajustement polynomial est une méthode de lissage des données et d'ajustement de courbe qui utilise des fonctions polynomiales pour approximer ou ajuster les données d'origine afin de mieux décrire la tendance ou le modèle des données. Le but de l'ajustement polynomial est de trouver une fonction polynomiale qui transmet les points de données donnés et qui s'ajuste bien à ces points.

La forme générale de l’ajustement polynomial est la suivante :

Parmi eux se trouve la variable indépendante, la variable dépendante dont dépend et le coefficient polynomial. En ajustant ces coefficients, vous pouvez mieux adapter la fonction polynomiale aux données.

L'ajustement polynomial est souvent utilisé dans les situations suivantes :

lissage des données: L'ajustement polynomial peut être utilisé pour supprimer le bruit ou les fluctuations des données afin d'obtenir une courbe lisse.
analyse de tendance: Les ajustements polynomiaux peuvent être utilisés pour identifier des tendances dans vos données, telles que des tendances linéaires (polynômes du premier ordre), des tendances quadratiques (polynômes du second ordre) ou des tendances d'ordre supérieur.
Courbe d'ajustement: L'ajustement polynomial peut être utilisé pour ajuster des données expérimentales afin d'obtenir le meilleur ajustement à un modèle théorique ou à une courbe théorique.
Interpolation des données:L'interpolation polynomiale est un cas particulier d'ajustement polynomial, qui estime des valeurs intermédiaires à l'aide de polynômes entre des points de données connus.

Le principe général de l’ajustement polynomial est de choisir l’ordre polynomial approprié. Un ordre trop faible peut ne pas bien s'adapter aux données, tandis qu'un ordre trop élevé peut entraîner un surapprentissage très sensible aux fluctuations des nouvelles données. Il est donc essentiel de choisir l’ordre polynomial approprié. Cas trinôme :

Partage de technologie