Κοινή χρήση τεχνολογίας

Εξομάλυνση δεδομένων (μέρος)

2024-07-12

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina

       1. Κινητός μέσος όρος

Είναι η απλούστερη μέθοδος εξομάλυνσης δεδομένων για την εξομάλυνση δεδομένων χρονοσειρών. Μειώνει το θόρυβο υπολογίζοντας τον μέσο όρο των σημείων δεδομένων μέσα σε ένα συγκεκριμένο παράθυρο διατηρώντας παράλληλα την τάση των δεδομένων.πακέτο κινούμενου μέσου όρουΠεριλαμβάνει τον απλό κινούμενο μέσο όρο (SMA)ή ευρετήριοΣταθμισμένος κινητός μέσος όρος (EMA).

        plt.rcParams['font.sans-serif'] = ['SimHei'],在整篇文章的代码中绘制图的时候加入此句代码,可以解决下图中文字标题显示不出的问题。

     1.1 απλός κινούμενος μέσος όρος (SMA)

Είναι μια μέθοδος εξομάλυνσης δεδομένων με τον υπολογισμό του μέσου όρου των σημείων δεδομένων σε ένα σταθερό παράθυρο. Το μέγεθος του παραθύρου καθορίζει τον βαθμό εξομάλυνσης. Ένα μεγαλύτερο παράθυρο θα έχει ως αποτέλεσμα μια πιο ομαλή καμπύλη, αλλά θα επιβραδύνει την απόκριση στις τάσεις, ενώ ένα μικρότερο παράθυρο θα είναι πιο ευαίσθητο στις επόμενες διακυμάνσεις στα δεδομένα.

Κατανόηση του παραπάνω κώδικα: Το μπλε γραμμικό γράφημα αντιπροσωπεύει τον πίνακα που δημιουργείται στον κώδικα. Πώς να υπολογίσετε τον απλό κινητό μέσο όρο:

Οι αλλαγές στο παράθυρο θα αλλάξουν το αποτέλεσμα εξομάλυνσης και τον βαθμό εξομάλυνσης με κόκκινο χρώμα. Όταν το μέγεθος του παραθύρου είναι 3, μπορεί να φανεί ότι το τμήμα που είναι δύσκολο να λειανθεί έχει εξαφανιστεί και η τραχιά καμπύλη γίνεται ομαλή, ωστόσο, όταν το μέγεθος του παραθύρου συνεχίζει να αυξάνεται, επιτυγχάνεται τελικά μια μικρή ευθεία γραμμή. Η κόκκινη καμπύλη είναι η καμπύλη πρόβλεψης.

Θα πρέπει να σημειωθεί ότι κατά την εγκατάσταση πακέτων seaborn και matplotlib, είναι δύσκολο να εγκατασταθεί χρησιμοποιώντας >python -m pip install matplotlib ή pip install matplotlib https://pypi.tuna.tsinghua.edu.cn/simple ή pin install matplotlib The εμφανίζεται το ακόλουθο μήνυμα στο τερματικό:

Δεν είναι δυνατή η αποσυσκευασία του αρχείου C:UsersHONORAppDataLocalTemppip-unpack-4qkfflipsimple.html (λήφθηκε από το C:UsersHONORAppDataLocalTemppip-req-build-s6_3j05c, τύπος περιεχομένου: text/html); δεν μπορεί να εντοπίσει τη μορφή αρχείου
ΣΦΑΛΜΑ: Δεν είναι δυνατός ο προσδιορισμός της μορφής αρχείου του C:UsersHONORAppDataLocalTemppip-req-build-s6_3j05c

Χρησιμοποιήστε την ακόλουθη δήλωση για να εγκαταστήσετε με επιτυχία:

εγκατάσταση pip -i https://pypi.tuna.tsinghua.edu.cn/simple --trusted-host pypi.tuna.tsinghua.edu.cn matplotlib

εγκατάσταση pip -i https://pypi.tuna.tsinghua.edu.cn/simple --trusted-host pypi.tuna.tsinghua.edu.cn seaborn

1.2 Εκθετικός σταθμισμένος κινητός μέσος όρος, EWMA

Ο εκθετικά σταθμισμένος κινητός μέσος όρος είναι μια μέθοδος εξομάλυνσης δεδομένων με την εφαρμογή εκθετικών βαρών στα σημεία δεδομένων.σε αυτόΤα πρόσφατα σημεία δεδομένων έχουν μεγαλύτερη βαρύτητα, και γιαΤα παλαιότερα σημεία δεδομένων έχουν μικρότερο βάρος .Αυτό κάνει το EMA περισσότεροΙδανικό για παρακολούθηση γρήγορων αλλαγώνΤα δεδομένα.

Κατανόηση του εκθετικά σταθμισμένου κώδικα κινητού μέσου όρου: Εισαγάγετε το αντίστοιχο πακέτο, δημιουργήστε τον αντίστοιχο πίνακα (δηλαδή, μπλε πολυγραμμή) και ορίστε τον παράγοντα εξομάλυνσης Όταν ο συντελεστής εξομάλυνσης είναι μικρότερος, το αποτέλεσμα εξομάλυνσης είναι ισχυρότερο. αντίστροφα. Ποιος είναι λοιπόν ο αλγόριθμος του εκθετικά σταθμισμένου κινητού μέσου όρου;

Ο σταθμισμένος κινητός μέσος όρος της περιόδου t χρησιμοποιείται ως η προβλεπόμενη τιμή της περιόδου t+1.

2. Εκθετική εξομάλυνση

Η εκθετική εξομάλυνση είναι μια ευρέως χρησιμοποιούμενη μέθοδος εξομάλυνσης και πρόβλεψης δεδομένων χρονοσειρών για την επεξεργασία δεδομένων με τάσεις και εποχικότητα. Καταγράφει τις μεταβαλλόμενες τάσεις των δεδομένων εκχωρώντας διαφορετικά βάρη σε ιστορικά σημεία δεδομένων και εκχωρώντας υψηλότερα βάρη σε νεότερα δεδομένα. Η εκθετική εξομάλυνση χρησιμοποιείται συχνά για τη δημιουργία προβλέψεων, ειδικά όταν πρέπει να γίνουν προβλέψεις για μελλοντικά χρονικά σημεία.

Τα κύρια χαρακτηριστικά της εκθετικής εξομάλυνσης περιλαμβάνουν:

  1. σταθμισμένη εξομάλυνση : Η εκθετική εξομάλυνση χρησιμοποιεί εκθετικά βάρη για την εξομάλυνση των δεδομένων. Τα νεότερα σημεία δεδομένων λαμβάνουν υψηλότερα βάρη, ενώ τα παλαιότερα σημεία δεδομένων λαμβάνουν χαμηλότερα βάρη. Αυτό σημαίνει ότι είναι πιο ευαίσθητο στα πρόσφατα δεδομένα, με αποτέλεσμα να καταγράφει καλύτερα τις τελευταίες τάσεις στα δεδομένα.

  2. τρεις κύριες μορφές : Υπάρχουν τρεις κύριες μορφές εκθετικής εξομάλυνσης: απλή εκθετική εξομάλυνση, διπλή εκθετική εξομάλυνση και τριπλή εκθετική εξομάλυνση. Κάθε φόρμα χρησιμοποιείται για διαφορετικούς τύπους δεδομένων και μοτίβων.

    • Η απλή εκθετική εξομάλυνση χρησιμοποιείται για την εξομάλυνση των δεδομένων με τάσεις και εποχικότητα.

    • Η Double Exponential Smoothing χρησιμοποιείται για την εξομάλυνση δεδομένων με τάσεις αλλά χωρίς εποχικότητα.

    • Η Triple Exponential Smoothing χρησιμοποιείται για την εξομάλυνση δεδομένων που έχουν τάση και εποχικότητα.

  3. Αναδρομική ενημέρωση: Η εκθετική εξομάλυνση είναι μια αναδρομική μέθοδος που συνδυάζει προηγούμενα εξομαλυνόμενα αποτελέσματα με νέα σημεία δεδομένων για να παράγει εξομαλυνόμενα αποτελέσματα για το επόμενο χρονικό σημείο.

  4. Ικανότητα πρόβλεψης : Η εκθετική εξομάλυνση δεν χρησιμοποιείται μόνο για την εξομάλυνση δεδομένων, αλλά μπορεί επίσης να χρησιμοποιηθεί για τη δημιουργία προβλέψεων για μελλοντικά χρονικά σημεία. Αυτό το καθιστά χρήσιμο σε τομείς όπως η πρόβλεψη ζήτησης, η πρόβλεψη τιμών μετοχών και η πρόβλεψη πωλήσεων.

  5. δυνατότητα εφαρμογής: Η εκθετική εξομάλυνση είναι κατάλληλη για σταθερά ή μη στάσιμα δεδομένα χρονοσειρών και μπορεί να χειριστεί καλά τις τάσεις, την εποχικότητα και τον θόρυβο.

  6. υπόθεση:

Εμφάνιση αποτελεσμάτων:

3. Πολυωνυμικό εξάρτημα

Το Polynomial Fitting είναι μια μέθοδος εξομάλυνσης δεδομένων και προσαρμογής καμπύλης που χρησιμοποιεί πολυωνυμικές συναρτήσεις για να προσεγγίσει ή να προσαρμόσει τα αρχικά δεδομένα προκειμένου να περιγράψει καλύτερα την τάση ή το μοτίβο των δεδομένων. Ο στόχος της πολυωνυμικής προσαρμογής είναι να βρεθεί μια πολυωνυμική συνάρτηση που περνά πάνω από τα δεδομένα σημεία και ταιριάζει καλά σε αυτά τα σημεία.

Η γενική μορφή πολυωνυμικής προσαρμογής είναι η εξής:

Μεταξύ αυτών, είναι η ανεξάρτητη μεταβλητή, είναι η εξαρτημένη μεταβλητή που εξαρτάται και είναι ο πολυωνυμικός συντελεστής. Προσαρμόζοντας αυτούς τους συντελεστές, μπορείτε να κάνετε την πολυωνυμική συνάρτηση να ταιριάζει καλύτερα στα δεδομένα.

Η πολυωνυμική προσαρμογή χρησιμοποιείται συχνά στις ακόλουθες περιπτώσεις:

  1. εξομάλυνση δεδομένων: Η πολυωνυμική προσαρμογή μπορεί να χρησιμοποιηθεί για την αφαίρεση του θορύβου ή των διακυμάνσεων στα δεδομένα για να αποκτήσετε μια ομαλή καμπύλη.

  2. ανάλυση τάσεων: Οι προσαρμογές πολυωνύμων μπορούν να χρησιμοποιηθούν για τον προσδιορισμό τάσεων στα δεδομένα σας, όπως γραμμικές τάσεις (πολυώνυμα πρώτης τάξης), τετραγωνικές τάσεις (πολυώνυμα δεύτερης τάξης) ή τάσεις υψηλότερης τάξης.

  3. Τοποθέτηση καμπύλης: Η πολυωνυμική προσαρμογή μπορεί να χρησιμοποιηθεί για την προσαρμογή πειραματικών δεδομένων για την επίτευξη της καλύτερης προσαρμογής σε ένα θεωρητικό μοντέλο ή μια θεωρητική καμπύλη.

  4. Παρεμβολή δεδομένων:Η πολυωνυμική παρεμβολή είναι μια ειδική περίπτωση πολυωνυμικής προσαρμογής, η οποία υπολογίζει ενδιάμεσες τιμές χρησιμοποιώντας πολυώνυμα μεταξύ γνωστών σημείων δεδομένων.

Η γενική αρχή της πολυωνυμικής προσαρμογής είναι η επιλογή της κατάλληλης σειράς πολυωνύμων. Μια παραγγελία που είναι πολύ χαμηλή μπορεί να μην ταιριάζει καλά στα δεδομένα, ενώ μια παραγγελία που είναι πολύ υψηλή μπορεί να οδηγήσει σε υπερπροσαρμογή που είναι πολύ ευαίσθητη στις διακυμάνσεις των νέων δεδομένων. Επομένως, η επιλογή της κατάλληλης πολυωνυμικής σειράς είναι το κλειδί. Τριωνυμική περίπτωση: