Machine Learning Weekly Report CF-LT

Machine Learning Weekly Report CF-LT 47. viikoksi

2024-07-12

Artikkelihakemisto

viikko 47 CF-LT
Yhteenveto
Abstrakti

viikko 47 CF-LT

Yhteenveto

Tällä viikolla luin artikkelin Tulkittava CEEMDAN-FE-LSTM-muuntajahybridimalli pintaveden kokonaisfosforipitoisuuksien ennustamiseksi. Tässä artikkelissa ehdotetaan hybridimallia TP-ennusteelle. Tässä artikkelissa ehdotetaan hybridimallia TP-ennusteelle, nimittäin CF-LT-mallia. Malli yhdistää innovatiivisesti täysin integroidun empiirisen moodihajoamisen (EMD) adaptiiviseen kohinankäsittelyyn, sumean entropiaanalyysin, pitkän lyhytaikaisen muistiverkon (LSTM) ja muuntajateknologian. Ottamalla käyttöön datataajuusjaon rekonstruktioteknologian tämä malli ratkaisee tehokkaasti yli- ja alisovitusongelmat, joita esiintyy herkästi, kun perinteiset koneoppimismallit käsittelevät korkeadimensionaalista dataa. Samalla huomiomekanismin soveltaminen mahdollistaa CF-LT-mallin ylittämisen muiden mallien rajoituksista, joiden avulla on vaikea määrittää pitkän aikavälin riippuvuuksia datan välillä pitkän aikavälin ennusteita tehtäessä. Ennustetulokset osoittavat, että CF-LT-malli saavutti määrityskertoimen (R2) 0,37 - 0,87 testiaineistossa, mikä oli merkittävä parannus 0,05 - 0,17 (eli 6 % - 85 %) verrattuna kontrolliin. malli. Lisäksi CF-LT-malli osoitti myös parhaan huippusuorituskyvyn.

Abstrakti

Tämän viikon viikkolehti purkaa paperin "Interpretable CEEMDAN-FE-LSTM-muuntajahybridimalli" pintaveden kokonaisfosforipitoisuuksien ennustamiseen. Tässä artikkelissa esitellään hybridimalli, CF-LT, erityisesti TP-ennustetta varten. Malli integroi innovatiivisesti Complete Ensemble Empirical Mode Decomposition (EMD) adaptiiviseen kohinankäsittelyyn, sumean entropiaanalyysiin, Long Short-Term Memory (LSTM) -verkkoihin ja Transformer-teknologiaan. Ottamalla käyttöön datan taajuuden jaon ja rekonstruoinnin CF-LT ratkaisee tehokkaasti yli- ja alisovitusongelmia, joita perinteiset koneoppimismallit usein kohtaavat käsitellessään korkeadimensionaalista dataa. Lisäksi huomiomekanismin soveltaminen antaa CF-LT:lle mahdollisuuden voittaa muiden mallien rajoitukset pitkäaikaisten riippuvuuksien määrittämisessä datapisteiden välillä pitkän aikavälin ennusteiden aikana. Ennustetulokset osoittavat, että CF-LT saavuttaa päätöskertoimen (R2), joka vaihtelee välillä 0,37 - 0,87 testiaineistoissa, mikä edustaa merkittävää parannusta 0,05 - 0,17 (tai 6 % - 85 %) verrattuna kontrollimalleihin. Lisäksi CF-LT tarjoaa parhaan huippusuorituskyvyn.

1. Kysymys

标题: Tulkittava CEEMDAN-FE-LSTM-muuntajahybridimalli pintaveden kokonaisfosforipitoisuuksien ennustamiseen

Kirjoittaja: Jiefu Yao, Shuai Chen, Xiaohong Ruan

julkaisu:Journal of Hydrology Osa 629, helmikuu 2024, 130609

链接: https://www.sciencedirect.com/science/article/pii/S0022169424000039?via%3Dihub

2. Abstrakti

Tässä artikkelissa ehdotetaan hybridimallia TP-ennusteelle. Tämä malli (CF-LT) yhdistää täysin integroidun empiirisen muodon hajotuksen (EMD) mukautuvan kohinan, sumean entropian, pitkän lyhytaikaisen muistin ja muuntajan.Datataajuusjaon rekonstruointiKäyttöönotto ratkaisee tehokkaasti yli- ja alisovitusongelmat, jotka ilmenivät, kun aikaisemmat koneoppimismallit kohtasivat korkeaulotteisen datan.huomiomekanismi Tämä ratkaisee ongelman, että nämä mallit eivät pysty muodostamaan pitkän aikavälin riippuvuuksia tietojen välillä ja tekemään pitkän aikavälin ennusteita. Ennustetulokset osoittavat, että CF-LT-malli saavuttaa testidatasarjan määrityskertoimen (R2) 0,37-0,87, mikä on 0,05-0,17 (6-85 %) korkeampi kuin kontrollimalli. Lisäksi CF-LT-malli tarjosi parhaan huippuennusteen.

3. Verkon rakenne

3.1 CEEMDAN (täysin mukautuva kohinayhtyeen empiirinen moodihajoaminen)

Edistyksellisenä aikasarjaanalyysimenetelmänä CEEMDAN vähentää tehokkaasti perinteisessä EMD:ssä esiintyvää moodialias-ongelmaa lisäämällä adaptiivista kohinaa empiiriseen moodihajotteluprosessiin (EMD). Se voi hajottaa alkuperäisen signaalin sarjaksi luontaisen tilan funktioita (IMF). Jokainen IMF edustaa signaalin eri aikaskaalaominaisuuksia, mikä tekee monimutkaisten signaalien analysoinnista intuitiivisempaa ja tarkempaa. Tässä tutkimuksessa CEEMDAN:ia käytettiin käsittelemään päivittäisiä vedenlaatutietoja kolmelta Taijärven seuranta-asemalta, jakamalla fosforin kokonaispitoisuus ja muut veden laatuparametrit, kuten veden lämpötila, pH, liuennut happi jne., signaaleiksi eri taajuuskaistoilla.

kuva-20240711193243810

Algoritmi S1: Täydellinen empiirinen muodon hajottaminen adaptiivisen kohinan kanssa (CEEMDAN)

Määritä operaattori $E_K(sim)$ , tämä operaattori luo EMD-algoritmin Kth malli. $v_t^i$ asetettu Gaussin valkoiseen kohinaan, $ϵ$ on valkoisen kohinakerroin, $i$ Valkoisen kohinan lisäämisindeksi. EMD:tä käytetään datan hajottamiseen, ja sen jälkeen kun alkuperäiseen signaaliin y(t) on lisätty Gaussin valkoinen kohina yhtälön (S1) mukaisesti, ensimmäinen sisäisen tilan funktion (IMF) komponentti ( $\overline{minä MF 1}$ ). Ensimmäinen tila lasketaan yhtälöllä (S2).

$y^{i}(t)=y(t)+epsilon_0v^i(t)quad i =1,2,pisteet,ntag{S1}$

$teksti{IMF1}_i=E_0(y^i(t))+r^i_1neliviiva{teksti{IMF1} }=frac1ntext{IMF1}_itag{S2}$

Laske ensimmäisen signaalin hajoamisen jäännökset yhtälön (S3) avulla. Lisää uusi valkoinen kohina yhtälön (S4) mukaan ja laske toinen IMF-komponentti (S4).

$r_1=y^i(t)-overline{text{IMF1}}tunniste{S3}$

$overline{text{IMF2}}=frac1nsum^n_{i=1}E_1(r_1+ epsilon_1E_1(v^i(t)))-tunniste{S4}$

Toista vaiheita 1 ja 2, kunnes jäännösr_k on monotoninen funktio. Käytä lopuksi EMD:tä saadaksesi K−1th IMF -sarjan, joka on sarjan alkuperäinen koostumus, kuten:

$y(t)=summa^{K-1}_{l=1}yliviiva{teksti{IMF1}}+r_Ktag{S5}$

3.2 CF-LT mallin rakenne

CEEMDAN-FE-osan osalta jaamme ensin alkuperäisen tietojoukon koulutus- ja testaustietosarjoiksi ja käytämme sitten CEEMDANia kahden tietojoukon kunkin ominaisuuden hajottamiseksi useiksi sisäisiksi toiminnoiksi (IMF). Kunkin IMF:n FE-arvojen läheisyyden mukaan ne rekonstruoidaan korkeataajuisiksi (IMFH), keskitaajuuksiksi (IMFM), matalataajuisiksi (IMFL) ja trenditermeiksi (IMFT) komponenteiksi, jotka heijastavat eri näkökohtia. IMF:stä.

LSTM-Transformer-osassa, kooderissa ja dekooderissa, LSTM:n piilotettu kerros korvataan Transformer position -koodauksella tulodatan välisen ajallisen riippuvuuden määrittämiseksi. Erityinen laskentaprosessi on seuraava (kuva 2a).

kuva-20240711190100763

Mallin sisääntulo koostuu kahdesta ominaisuustulosta. Tässä tutkimuksessa enkooderikerros sisältää veden lämpötilan (WT), pH:n (PH), liuenneen hapen (DO), kemiallisen hapenkulutuksen (COD), sähkönjohtavuuden (EC), sameuden (TU), ammoniakkitypen (NH3-N) ja kokonaistyppitiedot (TN) aikasarjamuodossa, jotka on saatu 7 päivää ennen ensimmäistä ennustettua ajankohtaa. Dekooderikerros sisältää TP-aikasarjan 7 päivää ennen ensimmäistä ennustusaikapistettä.
Kulkiessaan LSTM- ja lineaarikerroksen läpi nämä kaksi ominaisuustietojoukkoa syötetään kooderikerrokseen ja vastaavasti dekooderikerrokseen.
Kaksi alikerrosta muodostaa kooderikerroksen. Monen pään huomiotaso laskee syöteominaisuuksien huomiomatriisin, ja sitten eteenpäinsyöttökerros muuttaa dataulottuvuutta. Lopuksi tiedot syötetään seuraavaan kooderi- tai dekooderikerrokseen.
Kolme alikerrosta muodostaa dekooderikerroksen. Sen jälkeen, kun maskattu monen pään huomiokerros on laskenut syöteominaisuuksien huomiomatriisin, monipäinen huomiokerros muodostaa huomioyhteydet kooderikerroksen lähdön perusteella. Forward-kerros välittää sen seuraavalle dekooderikerrokselle tai lineaarikerrokselle saadakseen lopullisen mallin ulostulon.

3.3 MUOTO

SHAP on peliteoriamenetelmä minkä tahansa ML-mallin tulosteen tulkitsemiseen.Syöttöominaisuuksien vaikutuksen määrittämiseksi mallin ulostuloon syöttöominaisuudet $z = [z 1, ..., z s]$ Liittyy koulutettuun syväoppimismalliin F.
$F=f(z)=phi_0+sum_{i=1}^M phi_iz_i-tunniste{12}$
$φ_i ∈ R$ Ilmaisee kunkin ominaisuuden panoksen malliin, joka saadaan seuraavalla kaavalla:
$phi_i(F,x)=summa_{zleq x}frac{|z|!(M-|z|-1)!}{M!}[ F(z)-F(z/i)] -tunniste{13}$

4. Kirjallisuuden tulkinta

4.1 Johdanto

Tutkimuksessa ehdotetaan uutta mallia kokonaisfosforipitoisuuksien ennustamiseen. Malli yhdistää CEEM DAN-, FE-, LSTM- ja Transformer-teknologiat ja käyttää SHAP:ia mallin tulosteen tulkitsemiseen. Tämän tutkimuksen päätavoitteena on arvioida ehdotetun CEEMDAN-FE-LSTM-Transformer (CF-LT) -mallin suorituskykyä TP-pitoisuuden ennustamisessa Tai-järven suulla ja soveltaa SHAP:ia CF-LT:n tulosten tulkitsemiseen. malli. Tämän pitäisi paljastaa keskeiset tekijät, jotka vaikuttavat TP-pitoisuuteen alueella, ja niiden vastemekanismit.

Korkeadimensionaalinen datan hajottaminen voi tuottaa suuren määrän modaalisia komponentteja. Tämän ongelman ratkaisemiseksi Fuzzy Entropy (FE), tehokas menetelmä ajan monimutkaisuuden laskentaan, voidaan yhdistää CEEMDANin kanssa. Tämä yhdistelmä rekonstruoi tehokkaasti CEEMDANin hajotetut osasignaalit, mikä vähentää alitaajuusmallien määrää.

LSTMT-muuntajamallit voivat siepata suhteita ei-viereisten aikapisteiden välillä säilyttäen samalla syöttötietojen aikasarjan ominaisuudet.

Muuntajamallit käyttävät huomiomekanismeja kahden paikan välisten korrelaatioiden tunnistamiseen tietyssä kontekstissa koulutuksen aikana. Tämä mahdollistaa olennaisen tiedon tehokkaan hankinnan ja vähentää tiedon redundanssia.

4.2 Innovaatiopisteet

Tämän artikkelin tärkeimmät panokset ovat neljällä osa-alueella:

Ehdotettu malli yhdistää modaalianalyysin syvään oppimismenetelmiin, käyttää sumeaa entropiaa vähentämään modaalisen hajoamisen vaikutusta aikamonimutkaisuuteen ja yhdistää LSTM:n Transformerin kanssa pitkän ja lyhyen aikavälin riippuvuuksien rakentamiseksi dataan.
Kokonaisfosforin TP:n ennustamiseen käytetään hybridimallia, jossa käytetään LSTM:ää ja Transformeria, mitä ei ole tehty aiemmissa tutkimuksissa.
Ennustetulokset osoittavat, että CF-LT-malli saavuttaa testidatasarjan määrityskertoimen (R2) 0,37-0,87, mikä on 0,05-0,17 (6-85 %) korkeampi kuin kontrollimalli. Lisäksi CF-LT-malli tarjosi parhaan huippuennusteen.

4.3 Kokeellinen prosessi

tietojoukko : Taihu-järven allas sijaitsee Jangtse-joen alajuoksulla, ja sen pinta-ala on 36 900 neliökilometriä, tiheä jokiverkosto ja lukuisia järviä. Taihu-järvi on tyypillinen matala järvi. Altaalle on ominaista pohjoisen subtrooppisen vyöhykkeen kostea ilmasto, jonka keskimääräinen vuotuinen lämpötila on 15-17 °C ja keskimääräinen vuotuinen sademäärä 1181 mm. Tässä tutkimuksessa käytettiin Yaoxiangqiaon aseman, Zhihugangin aseman ja Guanduqiaon aseman vedenlaadun seurantatietoja (kuva S2). Nämä seuranta-asemat sijaitsevat Taihukoussa, joka on valtakunnallinen keskeinen vedenlaadun arviointiosasto. Tiedot ovat peräisin Jiangsun maakunnan ympäristönseurantakeskuksesta.

kuva-20240711193010590

Arviointikriteeri : Mallin suorituskyvyn arvioinnissa käytetään useita avainindikaattoreita: determinaatiokerroin (R²), keskimääräinen neliövirhe (MSE) ja keskimääräinen absoluuttinen prosenttivirhe (MAPE). R² mittaa sovitusasteen mallin ennustetun arvon ja todellisen arvon välillä, mikä tarkoittaa, että mallilla on vahva ennustekyky. MAPE heijastaa ennustevirheen kokoa prosentteina. Arvo Lower tarkoittaa tarkempia ennusteita.

Toteutustiedot : Kokeellinen prosessi sisältää tietojen esikäsittelyn, mallikoulutuksen ja testauksen. Täydellinen kokeellinen menettely on perustettu arvioimaan ehdotetun mallin suorituskykyä eri tietosarjoissa ja ennusteaikaikkunoissa. Ensinnäkin tiedot esikäsitellään CEEMDAN-FE-menetelmällä, joka poistaa informaatiohäiriöt lisäämällä täysin integroidun empiirisen muodon hajottelun adaptiivisella kohinalla, poimii monimittaista tietoa ja käyttää sumeaa entropiaa alisignaalien määrän vähentämiseen. Seuraavaksi käsitellyt tiedot jaetaan harjoitussarjaan ja testisarjaan suhteissa 75 % ja 25 %. Harjoitusvaiheessa esikäsitelty opetustietojoukko syötetään LSTM-Transformer-malliin. Käytä backpropagaatiota ja Adam Optimizer -työkalua mallien painojen päivittämiseen ja käytä ruudukkohakua LSTMTransformer-moduulin parhaiden hyperparametrien tunnistamiseen varmistaaksesi mallin suorituskyvyn eri ennusteaikaikkunoissa (7 päivää, 5 päivää, 3 päivää, 1 päivä) optimaalisesti.

Kokeelliset tulokset : Sovellettaessa parasta harjoitusmallia testiaineistoon taulukossa on yhteenveto CF-LT-, LSTM-, Transformer-, CF-L- ja CF-T-mallien TP-pitoisuusennusteista eri paikoissa ja erilaisissa ennusteaikaikkunoissa. Ehdotettu CF-LT-malli antaa parhaat tulokset kaikille kolmelle arviointimittarille. R2:n suhteen CF-LT-malli vaihtelee välillä 0,37-0,87, kun taas seuraavaksi parhaat CF-L- ja CF-T-mallit ovat 0,32-0,84 ja 0,35-0,86. Tämä osoittaa, että LSTM:n pitkän aikavälin muistin yhdistäminen Transformerin huomiomekanismiin voi parantaa ennusteen tarkkuutta. Kun verrataan huonoimpia LSTM- ja Transformer-malleja CF-L- ja CF-T-malleihin, MAPE vaihtelee välillä 8,94-20,62 % (LSTM) ja 8,91-18,73 % (Transformer) ja 8,29-19,56 % (CF -L). ja 7,82-17,55 % (CF-T). Nämä tulokset osoittavat, että tietojen hajottaminen ja taajuusjakomallinnus parantavat merkittävästi ennusteen tarkkuutta sieppaamalla enemmän alkuperäiseen dataan piilotettua tietoa.

kuva-20240711191527172

Kokonaisfosforin TP-pitoisuuteen vaikuttavien tekijöiden ennustaminen：

Keskimääräistä absoluuttista SHAP-arvoa (MASV) käytetään määrittämään syöteominaisuuksien (WT, PH, DO, COD, EC, TU, TN, NH3-N, TP) vaikutus TP-ennustetuloksiin sitä suurempi vaikutus mallin ennustetuloksiin. Tutkimukset osoittavat, että itse aiemman TP-pitoisuussarjan lisäksi kokonaistyppi (TN) ja sameus (TU) ovat kaksi pääasiallista TP-ennusteeseen vaikuttavaa tekijää. Tämä osoittaa, että TP:n muutoksiin eivät vaikuta suoraan historialliset pitoisuudet, vaan ne liittyvät myös läheisesti levien kasvudynamiikkaan, joka liittyy ei-pistekuormituspäästöihin ja typpi-fosforisuhteeseen vesistössä. Erityisesti TN:n ja TP:n välinen merkittävä korrelaatio korostaa näiden kahden kytkentävaikutusta järven ravinnekierrossa ja korostaa ei-pistelähteen typen syötteen merkitystä fosforipitoisuuden ennustamisessa.

kuva-20240711191709183

Näistä tuloksista voidaan tehdä seuraavat havainnot:

Oikeudenmukaisuuden mittareiden kannalta monet olemassa olevat GNN:t toimivat huonosti MLP-malleihin verrattuna kaikissa kolmessa tietojoukossa. Esimerkiksi Pokec-z-tietojoukossa MLP:n demografinen pariteetti on 32,64 %, 50,46 %, 66,53 % ja 58,72 % pienempi kuin GAT, GCN, SGC ja APPNP. Suurempi ennusteharha johtuu samojen herkän attribuuttisolmujen aggregaatioista ja kaaviotietojen topologisista poikkeamista.
FMP saavuttaa jatkuvasti alhaisimman ennustusharhan väestön tasa-arvon ja yhtäläisten mahdollisuuksien suhteen kaikissa tietosarjoissa. Tarkemmin sanottuna FMP vähentää demografista pariteettia 49,69 %, 56,86 % ja 5,97 % verrattuna Pokecz-, Pokec-n- ja NBA-tietosarjojen alhaisimpaan lähtötasoon. Samaan aikaan FMP saavuttaa parhaan tarkkuuden NBA-tietojoukossa ja saavuttaa vertailukelpoisen tarkkuuden Pokec-z- ja Pokec-n-tietosarjoissa. Lyhyesti sanottuna ehdotettu FMP voi tehokkaasti lieventää ennustusharhaa säilyttäen samalla ennusteen suorituskyvyn.

Vertailu kontradiktoriseen vääristelyyn ja laillistamiseen : Jaettu satunnaisesti 50 %/25 %/25 % koulutus-, validointi- ja testitietosarjoille. Kuvassa 2 on esitetty Pareto-optimikäyrät kaikille menetelmille, joissa oikea alakulma edustaa ihanteellista suorituskykyä (korkein tarkkuus ja pienin ennustepoikkeama).

kuva-20240707171047802

5. Päätelmät

Tässä artikkelissa ehdotettu CF-LT-hybridimalli yhdistää CEEM DAN-, FE-, LSTM- ja Transformer-moduulit pintaveden TP-pitoisuuden ennustamiseksi. Tämä hybridilähestymistapa ratkaisee korkeadimensionaalisten tietojen aiheuttamat mallien yli- ja alisovittamisen puutteet sekä kyvyttömyyden muodostaa pitkän aikavälin riippuvuuksia datan välillä pitkän aikavälin ennusteita tehtäessä. Lisäksi SHAP-arvoja käytetään tulkitsemaan CF-LT-mallin ulostuloa.

Malli käyttää kolmen Taihu-järven altaan vedenlaadun seuranta-aseman tietoja tuottaakseen 9 vedenlaadun indikaattoria eri ennusteaikaikkunoissa. Ohjausmalleina käytetään LSTM-, Transformer-, CF-L- ja CF-T-algoritmeja. CF-LT-mallin R2-arvo on 0,37–0,87, MSE-arvo 0,34 × 10–3–1,46 × 10–3 ja MAPE-arvo 7,88–17,63 % testiaineistossa, mikä osoittaa, että kaikki kolme indikaattorit ovat parempia kuin LSTM, Transformer, CF-L ja CF-T tulokset. Ehdotettu CF-LT-malli tuotti myös parhaat huipputulokset. SHAP-tulkinnan perusteella havaitsimme, että TU ja TN (pois lukien TP-pitoisuuden varhaiset aikasarjat) ovat tärkeitä TP-ennusteeseen vaikuttavia tekijöitä, mikä osoittaa, että muutokset TP:ssä eivät liity pelkästään TP-pitoisuuden varhaisiin tasoihin, vaan myös TP:n vaikutuksiin. keskittyminen. Ei-pisteperäisten saastepäästöjen ja vesikasvien välinen suhde Taihu-järven suistossa. Lisäksi on syytä huomata, että TN ja TU vaikuttavat enemmän TP-pitoisuuden ennustamiseen sadekauden aikana. Siksi tämän tutkimuksen tulokset osoittavat, että CF-LT-malli tarjoaa lisätietoa TP:n vastemekanismin ymmärtämiseksi, kun erilaiset ympäristöolosuhteet muuttuvat.

6. Koodin toisto

CEEMDAN ja FE tietojen esikäsittely

def ceemdan_fe_preprocessing(data):
    # CEEMDAN分解
    imfs, residue = ceemdan(data, **ceemdan_params)
    
    # 计算各个IMF的模糊熵
    fe_values = []
    for imf in imfs:
        fe_values.append(fuzzy_entropy(imf)) # 假定fuzzy_entropy为计算模糊熵的函数
    
    # 根据FE值重组IMFs
    imfs_sorted = [imf for _, imf in sorted(zip(fe_values, imfs))]
    imf_hf, imf_mf, imf_lf, imf_trend = imfs_sorted[:4], imfs_sorted[4:8], imfs_sorted[8:12], imfs_sorted[12:]
    return np.concatenate((imf_hf, imf_mf, imf_lf, imf_trend), axis=1)
 
# 应用到数据上
preprocessed_data = ceemdan_fe_preprocessing(original_data)
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16

LSTM&Transformer

def get_positional_encoding(max_len, d_model):
    pe = np.zeros((max_len, d_model))
    position = np.arange(0, max_len).reshape(-1, 1)
    div_term = np.exp(np.arange(0, d_model, 2) * -(np.log(10000.0) / d_model))
    pe[:, 0::2] = np.sin(position * div_term)
    pe[:, 1::2] = np.cos(position * div_term)
    return pe
 
def transformer_encoder(inputs, d_model, num_heads, ff_dim):
    x = MultiHeadAttention(num_heads=num_heads, key_dim=d_model)(inputs, inputs)
    x = LayerNormalization()(Add()([inputs, x]))
    x = Dense(ff_dim, activation='relu')(x)
    x = Dense(d_model)(x)
    x = LayerNormalization()(Add()([inputs, x]))
    return x
 
def transformer_decoder(inputs, encoder_outputs, d_model, num_heads, ff_dim):
    return decoder_output
 
input_features = Input(shape=(input_shape))
lstm_out = LSTM(lstm_units)(input_features) # LSTM
 
pos_encodings = get_positional_encoding(max_seq_length, d_model)
 
transformer_in = Add()([lstm_out, pos_encodings])
transformer_encoded = transformer_encoder(transformer_in, d_model, num_heads, ff_dim)
 
decoder_output = transformer_decoder(decoder_input, transformer_encoded, d_model, num_heads, ff_dim)
 
output_layer = Dense(output_dim, activation='linear')(decoder_output)
model = Model(inputs=input_features, outputs=output_layer)
 
model.compile(optimizer=Adam(learning_rate), loss='mse')
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33

yhteenveto

Tässä tutkimuksessa kehitettiin tulkittava CEEMDAN-FE-LSTM-Transformer-hybridimalli pintaveden kokonaisfosforipitoisuuden ennustamiseen. Malli paransi merkittävästi ennustetarkkuutta edistyneen tiedon esikäsittelytekniikan ja syväoppimismallien yhdistämisen ansiosta, ja tarjoaa selkeän ominaisuusselvityksen. SHAPin kautta. Kokeelliset tulokset vahvistivat mallin tehokkuuden, erityisesti keskeisten ympäristötekijöiden tunnistamisen, tarjoten tehokkaan työkalun vesistöjen rehevöitymisen hallintaan ja pilaantumisen hallintaan.

viittauksia

[1] Jiefu Yao, Shuai Chen, Xiaohong Ruan. Tulkittava CEEMDAN-FE-LSTM-muuntajahybridimalli pintaveden kokonaisfosforipitoisuuksien ennustamiseen. [J]Journal of Hydrology Osa 629, helmikuu 2024, 130609

Teknologian jakaminen