Berbagi teknologi

Pemulusan data (bagian)

2024-07-12

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina

       1. Rata-Rata Pergerakan

Ini adalah metode pemulusan data paling sederhana untuk menghaluskan data deret waktu. Ini mengurangi noise dengan menghitung rata-rata titik data dalam jendela tertentu sambil mempertahankan tren data.paket rata-rata bergerakTermasuk Rata-Rata Pergerakan Sederhana (SMA)atau indeksRata-Rata Pergerakan Tertimbang (EMA).

        plt.rcParams['font.sans-serif'] = ['SimHei'],在整篇文章的代码中绘制图的时候加入此句代码,可以解决下图中文字标题显示不出的问题。

     1.1 Rata-Rata Pergerakan Sederhana (SMA)

Ini adalah metode menghaluskan data dengan menghitung rata-rata titik data dalam jangka waktu tertentu. Ukuran jendela menentukan tingkat kehalusan. Jendela yang lebih besar akan menghasilkan kurva yang lebih mulus namun akan memperlambat respons terhadap tren, sedangkan jendela yang lebih kecil akan lebih sensitif terhadap fluktuasi data yang mengikuti.

​ Pemahaman kode di atas: Bagan garis biru mewakili array yang dihasilkan dalam kode. Cara menghitung rata-rata pergerakan sederhana:

Perubahan pada jendela akan mengubah efek penghalusan dan derajat penghalusan dengan warna merah. Bila ukuran jendelanya 3, terlihat bagian yang sulit dihaluskan sudah hilang, dan kurva kasar menjadi mulus, namun bila ukuran jendela terus diperbesar akhirnya diperoleh garis lurus kecil. Kurva merah adalah kurva prediksi.

Perlu dicatat bahwa ketika menginstal paket seaborn dan matplotlib, sulit untuk menginstal menggunakan >python -m pip install matplotlib atau pip install matplotlib https://pypi.tuna.tsinghua.edu.cn/simple atau pin install matplotlib The prompt berikut muncul di terminal:

Tidak dapat membongkar berkas C:UsersHONORAppDataLocalTemppip-unpack-4qkfflipsimple.html (diunduh dari C:UsersHONORAppDataLocalTemppip-req-build-s6_3j05c, tipe konten: text/html); tidak dapat mendeteksi format arsip
KESALAHAN: Tidak dapat menentukan format arsip C:UsersHONORAppDataLocalTemppip-req-build-s6_3j05c

Gunakan pernyataan berikut untuk menginstal dengan sukses:

pip install -i https://pypi.tuna.tsinghua.edu.cn/simple --trusted-host pypi.tuna.tsinghua.edu.cn matplotlib

pip install -i https://pypi.tuna.tsinghua.edu.cn/simple --trusted-host pypi.tuna.tsinghua.edu.cn seaborn

1.2 Rata-Rata Pergerakan Tertimbang Eksponensial, EWMA

Rata-rata pergerakan tertimbang secara eksponensial adalah metode menghaluskan data dengan menerapkan bobot eksponensial pada titik data.untuk ituPoin data terbaru diberi bobot lebih tinggi, dan untukPoin data yang lebih lama diberi bobot yang lebih rendah .Hal ini membuat EMA lebih banyakIdeal untuk melacak perubahan yang cepatData.

Pemahaman tentang kode rata-rata pergerakan tertimbang secara eksponensial: Impor paket yang sesuai, buat larik yang sesuai (yaitu, polyline biru), dan tentukan faktor penghalusan. Ketika faktor penghalusan lebih kecil, efek penghalusan lebih kuat. dan sebaliknya. Jadi apa algoritma rata-rata pergerakan tertimbang secara eksponensial?

Rata-rata pergerakan tertimbang periode t digunakan sebagai nilai prediksi periode t+1.

2. Pemulusan Eksponensial

Pemulusan Eksponensial adalah metode pemulusan dan peramalan data deret waktu yang umum digunakan untuk memproses data dengan tren dan musiman. Ini menangkap tren perubahan data dengan memberikan bobot berbeda pada titik data historis dan memberikan bobot lebih tinggi pada data baru. Pemulusan eksponensial sering digunakan untuk menghasilkan perkiraan, terutama ketika perkiraan perlu dibuat untuk titik waktu di masa depan.

Fitur utama pemulusan eksponensial meliputi:

  1. pemulusan tertimbang : Pemulusan eksponensial menggunakan bobot eksponensial untuk memuluskan data. Titik data yang lebih baru menerima bobot yang lebih tinggi, sedangkan titik data yang lebih lama menerima bobot yang lebih rendah. Artinya, data tersebut lebih sensitif terhadap data terkini, sehingga dapat menangkap tren terkini dalam data dengan lebih baik.

  2. tiga bentuk utama : Ada tiga bentuk utama pemulusan eksponensial: pemulusan eksponensial sederhana, pemulusan eksponensial ganda, dan pemulusan eksponensial rangkap tiga. Setiap formulir digunakan untuk tipe data dan pola yang berbeda.

    • Simple Exponential Smoothing digunakan untuk menghaluskan data dengan tren dan musiman.

    • Pemulusan Eksponensial Ganda digunakan untuk memperhalus data yang memiliki tren tetapi tidak ada musim.

    • Triple Exponential Smoothing digunakan untuk menghaluskan data yang memiliki tren dan musiman.

  3. Pembaruan rekursif: Pemulusan eksponensial adalah metode rekursif yang menggabungkan hasil pemulusan sebelumnya dengan titik data baru untuk menghasilkan hasil pemulusan pada titik waktu berikutnya.

  4. Kemampuan untuk memprediksi : Pemulusan eksponensial tidak hanya digunakan untuk menghaluskan data, tetapi juga dapat digunakan untuk menghasilkan perkiraan titik waktu di masa depan. Hal ini membuatnya berguna dalam berbagai bidang seperti perkiraan permintaan, perkiraan harga saham, dan perkiraan penjualan.

  5. penerapan: Pemulusan eksponensial cocok untuk data deret waktu yang stasioner atau non-stasioner, dan dapat menangani tren, musiman, dan kebisingan dengan baik.

  6. kasus:

Tampilan hasil:

3. Pemasangan polinomial

Polynomial Fitting adalah metode pemulusan data dan penyesuaian kurva yang menggunakan fungsi polinomial untuk memperkirakan atau menyesuaikan data asli agar lebih menggambarkan tren atau pola data. Tujuan dari pemasangan polinomial adalah untuk menemukan fungsi polinomial yang melewati titik-titik data tertentu dan cocok dengan titik-titik tersebut.

Bentuk umum pemasangan polinomial adalah sebagai berikut:

Diantaranya adalah variabel bebas, merupakan variabel terikat yang bergantung, dan merupakan koefisien polinomial. Dengan menyesuaikan koefisien ini, Anda dapat membuat fungsi polinomial lebih sesuai dengan data.

Pemasangan polinomial sering digunakan dalam situasi berikut:

  1. pemulusan data: Pemasangan polinomial dapat digunakan untuk menghilangkan noise atau fluktuasi data untuk mendapatkan kurva yang mulus.

  2. analisis tren: Kesesuaian polinomial dapat digunakan untuk mengidentifikasi tren dalam data Anda, seperti tren linier (polinomial orde pertama), tren kuadrat (polinomial orde kedua), atau tren orde tinggi.

  3. Pemasangan Kurva: Pencocokan polinomial dapat digunakan untuk menyesuaikan data eksperimen guna mendapatkan kesesuaian terbaik dengan model teoretis atau kurva teoretis.

  4. Interpolasi data:Interpolasi polinomial adalah kasus khusus pemasangan polinomial, yang memperkirakan nilai antara menggunakan polinomial antara titik data yang diketahui.

Prinsip umum pemasangan polinomial adalah memilih urutan polinomial yang sesuai. Urutan yang terlalu rendah mungkin tidak cocok dengan data, sedangkan urutan yang terlalu tinggi dapat mengakibatkan overfitting yang sangat sensitif terhadap fluktuasi data baru. Oleh karena itu, memilih urutan polinomial yang sesuai adalah kuncinya. Kasus trinomial: