技術共有

データ平滑化(一部)

2024-07-12

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina

       1. 移動平均

これは、時系列データを平滑化するための最も単純なデータ平滑化方法です。データの傾向を維持しながら、特定のウィンドウ内のデータ ポイントの平均を計算することでノイズを低減します。移動平均パッケージ単純移動平均 (SMA) を含むまたはインデックス加重移動平均 (EMA)。

        plt.rcParams['font.sans-serif'] = ['SimHei'],在整篇文章的代码中绘制图的时候加入此句代码,可以解决下图中文字标题显示不出的问题。

     1.1 単純移動平均 (SMA)

これは、固定ウィンドウ内のデータ ポイントの平均を計算することでデータを平滑化する方法です。ウィンドウのサイズによって平滑化の程度が決まります。ウィンドウを大きくすると、曲線はより滑らかになりますが、傾向への反応が遅くなります。一方、ウィンドウを小さくすると、データの変動に従うことがより敏感になります。

上記のコードの理解: 青い折れ線グラフは、コードで生成された配列を表します。単純移動平均の計算方法:

ウィンドウを変更すると、スムージング効果と赤色のスムージングの度合いが変わります。ウィンドウサイズを3にすると、滑らかにしにくい部分がなくなり、粗い曲線が滑らかになっていることがわかりますが、ウィンドウサイズを大きくし続けると、最終的に小さな直線が得られます。赤い曲線は予測曲線です。

seaborn および matplotlib パッケージをインストールする場合、>python -m pip install matplotlib または pip install matplotlib https://pypi.tuna.tsinghua.edu.cn/simple または pin install matplotlib を使用してインストールするのは難しいことに注意してください。次のプロンプトがターミナルに表示されます。

ファイル C:UsersHONORAppDataLocalTemppip-unpack-4qkfflipsimple.html を解凍できません (C:UsersHONORAppDataLocalTemppip-req-build-s6_3j05c からダウンロード、コンテンツ タイプ: text/html)。アーカイブ形式を検出できません。
エラー: C:UsersHONORAppDataLocalTemppip-req-build-s6_3j05c のアーカイブ形式を判別できません

正常にインストールするには、次のステートメントを使用します。

pip インストール -i https://pypi.tuna.tsinghua.edu.cn/simple --trusted-host pypi.tuna.tsinghua.edu.cn matplotlib

pip インストール -i https://pypi.tuna.tsinghua.edu.cn/simple --trusted-host pypi.tuna.tsinghua.edu.cn seaborn

1.2 指数加重移動平均、EWMA

指数加重移動平均は、データ ポイントに指数加重を適用してデータを平滑化する方法です。それに最近のデータポイントにはより高い重みが与えられます、そしてのために古いデータポイントには低い重みが与えられます 。これによりEMAはさらに上昇します急速な変化の追跡に最適データ。

指数加重移動平均コードの理解: 対応するパッケージをインポートし、対応する配列 (つまり、青いポリライン) を生成し、平滑化係数を定義します。平滑化係数が小さいほど、平滑化効果はより強くなります。逆に。それでは、指数加重移動平均のアルゴリズムとは何でしょうか?

期間 t の加重移動平均が期間 t+1 の予測値として使用されます。

2. 指数平滑法

指数平滑法は、傾向や季節性のあるデータを処理するために一般的に使用される時系列データの平滑化および予測方法です。過去のデータ ポイントに異なる重みを割り当て、新しいデータにはより高い重みを割り当てることで、データの変化する傾向を捉えます。指数平滑法は、特に将来の時点について予測を行う必要がある場合に、予測を生成するためによく使用されます。

指数平滑法の主な機能は次のとおりです。

  1. 加重平滑化 : 指数平滑化では、指数重みを使用してデータを平滑化します。新しいデータ ポイントにはより高い重みが与えられ、古いデータ ポイントにはより低い重みが与えられます。これは、最近のデータに対する感度がより高く、データの最新の傾向をより適切に捕捉できることを意味します。

  2. 3つの主要な形式 : 指数平滑法には、単純指数平滑法、二重指数平滑法、三重指数平滑法の 3 つの主な形式があります。各フォームは、さまざまなタイプのデータとパターンに使用されます。

    • 単純な指数平滑法は、傾向と季節性を考慮してデータを平滑化するために使用されます。

    • 二重指数平滑法は、傾向はあるが季節性はないデータを平滑化するために使用されます。

    • 三重指数平滑法は、傾向と季節性の両方を持つデータを平滑化するために使用されます。

  3. 再帰的な更新: 指数平滑化は、以前の平滑化結果と新しいデータ ポイントを組み合わせて、次の時点の平滑化結果を生成する再帰的手法です。

  4. 予測する能力 : 指数平滑化は、データを平滑化するために使用されるだけでなく、将来の時点の予測を生成するためにも使用できます。これは、需要予測、株価予測、売上予測などの分野で役立ちます。

  5. 適用性: 指数平滑化は、定常または非定常時系列データに適しており、傾向、季節性、ノイズを適切に処理できます。

  6. 場合:

結果の表示:

3. 多項式フィッティング

多項式フィッティングは、データの傾向やパターンをより適切に説明するために、多項式関数を使用して元のデータを近似または近似するデータの平滑化および曲線フィッティングの方法です。多項式フィッティングの目的は、指定されたデータ ポイントを通過し、それらのポイントを適切にフィットさせる多項式関数を見つけることです。

多項式フィッティングの一般的な形式は次のとおりです。

このうち、 は独立変数、 は依存する従属変数、 は多項式係数です。これらの係数を調整することで、多項式関数をデータによりよく適合させることができます。

多項式フィッティングは、次の状況でよく使用されます。

  1. データの平滑化: 多項式フィッティングを使用してデータのノイズや変動を除去し、滑らかな曲線を得ることができます。

  2. トレンド分析: 多項式近似を使用すると、線形トレンド (1 次多項式)、2 次トレンド (2 次多項式)、または高次トレンドなどのデータの傾向を特定できます。

  3. カーブフィッティング: 多項式フィッティングを使用して実験データをフィッティングし、理論モデルまたは理論曲線に最適なフィッティングを得ることができます。

  4. データ補間:多項式補間は、既知のデータ点間の多項式を使用して中間値を推定する多項式フィッティングの特殊なケースです。

多項式フィッティングの一般原則は、適切な多項式次数を選択することです。次数が低すぎるとデータにうまく適合しない可能性があり、次数が高すぎると新しいデータの変動に非常に敏感な過剰適合が発生する可能性があります。したがって、適切な多項式次数を選択することが重要です。三項式の場合: