[Paper Quick Reading] "Joint Message Passing and Autoenkooders for Deep Learning"

[Paper Quick Reading] "Joint Message Passing and Autoencoders for Deep Learning"

2024-07-11

Tämä artikkeli on peräisin Huawein Ottawa Wireless Advanced System Competence Centeristä ja Wireless Technology Laboratorysta. Kirjoittajien joukossa on kuuluisa Tong Wen.
Lisää kuvan kuvaus tähän

1. Itsekoodausarkkitehtuurilla varustettujen globaalien lähetin-vastaanottimien tärkeimmät ongelmat

Minulle artikkelin inspiroivin osa on, että siinä mainitaan tärkeimmät ongelmat, joita globaalien lähetin-vastaanottimien kohtaaminen itsekoodaavalla arkkitehtuurilla:
Kysymys 1: Stokastisen gradientin laskeutumismenetelmän perusteella takaisinetenemisalgoritmin käyttäminen autoenkooderin kouluttamiseen vaatii yhden tai useamman differentioituvan kanavamallikerroksen yhdistämään lähettimen syvän hermokerroksen ja vastaanottimen syvän hermokerroksen. Koska todellisen kanavan on sisällettävä monia epälineaarisia komponentteja (kuten digitaalinen tai analoginen esisärö ja muunnos) ja se sisältää ei-differentioituvia vaiheita, kuten ylös- ja alasnäytteistys, lähetin-vastaanottimen syvän hermokerroksen harjoittama malli perustuu pikemminkin rakennettuun kanavaan. kuin oikea kanava. Todellisissa kanavaskenaarioissa tällä tavalla saatu malli voi aiheuttaa suorituskyvyn menetyksiä päättelyvaiheen aikana.
Lisää kuvan kuvaus tähän
Kysymys 2: Kaikki piilotetut kerrokset tai välikerrokset opetetaan tulosignaalin posteriorisen todennäköisyyden perusteella. Autoencoderin globaalissa lähetin-vastaanottimessa vastaanottimen syvän hermokerroksen ensimmäinen kerros on välikerros, jonka tulosignaali on alttiina nykyiselle kanavasärölle. Tämä vaikutus läpäisee väistämättä kaikki vastaanottimen syvät hermokerrokset. Jos kanava muuttuu asteittain, joka ylittää harjoitusodotukset, se aiheuttaa vastaanottimen epäonnistumisen päättelyvaiheen aikana.
Lisää kuvan kuvaus tähän

Ongelma 3: Hermokerrosten välillä on tulkittavuuden puute, ja on mahdotonta tietää, mitkä neuronit ja mitkä hermokerrosten väliset yhteydet vaikuttavat tehokkaasti lopulliseen oppimistarkkuuteen. Goodfellow ym. antoivat esimerkin syvän neuroverkon luokittimesta, joka, vaikka se on hyvin koulutettu kohinattomille kuville, saattaa silti luokitella meluiset pandakuvat gibboneiksi. Tämä esimerkki osoittaa, että syviin hermoverkkoihin perustuva luokitin nojaa vahvasti joihinkin "kriittisiin polkuihin" (viittaen joihinkin pandakuvan pikseleihin, jotka tunnetaan myös "paikallisina piirteinä") tehdessään lopullista päätöstä. Jos kriittinen polku on ehjä, tehdään oikea luokitus, jos kriittinen polku on häiriintynyt. Samanaikaisesti tällainen kohinan aiheuttama virheluokitus on vain satunnainen tilanne additiivisen satunnaisen kohinan läsnä ollessa, mikä osoittaa, että syvä hermoverkko perustuu oletukseen, että "kriittistä polkua" käsittelee kohinakanava Still ehjänä. Syvät neuroverkot ovat herkkiä additiiviselle satunnaiselle kohinalle, joka on lähes kohtalokasta niiden sovellukselle langattomien lähetin-vastaanottimien suunnittelussa.
Lisää kuvan kuvaus tähän

Näiden kolmen ongelman olemus johtuu samasta ydinongelmasta, eli syvien hermoverkkojen yleistyssuorituskyky on liian huono kohdatessa satunnaisia muutoksia langattomissa kanavissa. Mikään malli (edes erittäin ylivoimainen kanavamalli) ei pysty kaappaamaan täysin kaikkia mahdollisia radion leviämisen skenaarioita, joten jakelun ulkopuolisten (OOD) näytteiden tai poikkeamien käsittely on se, mitä automaattienkooderien on aina kohdattava.
Vielä pahempaa on, että olemassa olevat ratkaisut näihin ongelmiin kohtaavat edelleen monia esteitä, koska ehdotettujen ratkaisujen on täytettävä käytännön vaatimukset alhaisesta energiankulutuksesta, alhaisesta latenssista ja alhaisesta langattomasta viestintälaitteistosta ja infrastruktuurista. Toisaalta dynaamisessa ympäristössä itse autoencoder-lähetin-vastaanottimen keräämisen, parantamisen ja uudelleenkoulutuksen kustannukset ovat liian korkeat, toisaalta koko keräämis-, tehostamis- ja uudelleenkoulutusprosessi rikkoo myös "syvän hermoverkon" toimintaa. Kertaluonteinen strategia - eli kerran oppiminen ja pitkällä aikavälillä tehokas ei pysty vastaamaan todellisiin tarpeisiin ja energiankulutusvaatimuksiin.

Langattomissa skenaarioissa poikkeamat johtuvat usein satunnaisista muutoksista kanavassa. Päättelyvaiheen aikana, jos kanava muuttuu ja poikkeaa koulutusvaiheessa käytetystä kanavamallista, poikkeamien ongelma on erityisen näkyvä. Päättelyn edetessä ilmestyy enemmän poikkeavuuksia, jotka vaikuttavat vastaanotetun signaalin jakautumismuotoon. Tällä hetkellä on olemassa joitain parannuskeinoja, kuten lisäkoulutus, mukaan lukien siirtokoulutus, huomiopohjaiset toistuvat verkostot tai vahvistusoppiminen. Tulevaisuuden langattoman viestinnän alhaisen energiankulutuksen, alhaisen latenssin ja alhaisen ohjausmäärän vaatimukset huomioon ottaen nämä korjaustoimenpiteet ovat kuitenkin tulleet epäkäytännöllisiksi, eivätkä ne ole toteutettavissa.

Artikkelissa ehdotetun MPA-menetelmän osalta artikkelissa analysoidaan myös ratkaisuideoita keskittyen alla mustalla merkkaamiini osiin:
"Ensinnäkin erotettavuuden saavuttamiseksi kanavamallia on yksinkertaistettava, mutta tämä yksinkertaistaminen heikentää autoencoder-lähetin-vastaanottimen suorituskykyä. Syy suorituskykyvaurioon on se, että autoenkooderin kouluttamiseen käytetty kanavamalli on yksinkertaistettu malli. Todellinen malli Toisin sanoen harjoitusvaiheessa käytetyn yksinkertaistetun kanavan ja päättelyvaiheessa käsitellyn kanavan välillä on poikkeama, jos offset kasvaa yli odotusten ovat kaksi tapaa lieventää tätä suorituskyvyn heikkenemistä. Ensimmäinen on vahvistusoppimisen käyttö kanavan tilan jatkuvaan tallentamiseen ja politiikan DNN:n ja/tai arviointi-DNN:n jatkuvaan kouluttamiseen. Mittojen monimutkaisuuden kannalta vahvistusoppiminen on kuitenkin liian monimutkaista langattomille järjestelmille, koska vahvistusoppimisen käsittelemät mitat ovat itse asiassa paljon suurempia kuin AlphaGo. Siksi vahvistusoppimiseen perustuva säätömekanismi ei ole mahdollinen. Toinen on käyttää Generative Adversary Networkia (GAN) oppiaksesi mahdollisimman monta kanavaskenaariota suureksi syvälle hermoverkkomalliksi.Tämä on kuitenkin empiirinen menetelmä, eikä voida osoittaa, että menetelmä kattaa kaikki kanavaskenaariot.。

Edellä mainitut ongelmat huomioon ottaen MPA:lla varustetut autoenkooderit valitsevat toisenlaisen teknisen polun. Päättelyvaiheessa MPA säätää ulottuvuuden vähennyskerroksen kertoimia nykyisessä kanavan mittaustoiminnossa kullekin tiedonsiirrolle. Siksi adaptiivinen päättely käyttää opetusvaiheessa karkeaa kanavamallia, jota kutsumme "karkeaksi oppimiseksi". Jos karkeaoppiminen simuloi samaa tai samanlaista kanavamallia sekä harjoitus- että päättelyvaiheessa, on karkean oppimisen etua vaikea todistaa, mutta tämä etu voidaan osoittaa varsinaisissa kenttäkokeissa.

Toiseksi MPA:lla varustetut autoenkooderit voivat työskennellä yhdessä generatiivisiin kontradiktorisiin verkkoihin perustuvien kanavamallien kanssa. Kokemuksen mukaan useimpien kanavien todelliset olosuhteet riippuvat käyttäjän sijainnista ja ympäristön topologiasta, kuten korkeista rakennuksista, kukkuloista, teistä jne. Referenssit ehdottivat ehdollisten generatiivisten kontradiktoristen verkkojen käyttöä tuntemattomien kanavien mallintamiseen ja saavuttivat hyvän suorituskyvyn.Tämän menetelmän avulla voimme rakentaa kanavamallin, joka tarjoaa hyvän tuen koulutusvaiheelle。

Suosittelemme päättelyvaiheen aikana luottamaan pilottien kanavaarvioihin, kanavamittauksen palautteeseen tai kanavan vastavuoroisuuteen uusimpien kanavaolosuhteiden saamiseksi. Tiedetään, että MPA hyötyy myös harvakseltaan ja sietää paremmin poikkeamia ja poikkeamia (siksi LDPC-dekooderit voivat toimia tehokkaasti). Tästä näkökulmasta katsottuna ei ole tarvetta suorittaa täysimittaista kanavamittausta, vain osa dimensioista on mitattava Vaikka estimointivirhe olisikin, mallimme on silti hyvä kokonaissuorituskyky. Lisäksi jäännökset voidaan käsitellä vastaanottamalla syviä hermokerroksia, joilla on korkeampi virhetoleranssi. Koska dimensiovähennyskerrosta on säädetty päättely- ja opetusvaiheiden aikana, voimme käyttää ulottuvuuden vähennyskerrosta koko lähetysketjun esikooderina, joten syvää hermokerrosta ei tarvitse kouluttaa uudelleen. Tämä ei tuo vain energiansäästöetuja, vaan on myös valtava etu käyttäjien laitteiden akun käyttöiän pidentämisessä. "

2. Nopea artikkeleiden lukeminen

Itse asiassa olen edelleen skeptinen artikkelissa ehdotetun menetelmän suhteen. Katsotaanpa lyhyesti artikkelin menetelmää.

Artikkelin yhteenveto

Artikkelissa ehdotetaan MPA-algoritmiin (Message Passing Algorithm) perustuvaa autoencoder-lähetin-vastaanotinta, joka ratkaisee perinteisten automaattisten kooderien huonon yleistyssuorituskyvyn ongelman satunnaisten kanavamuutosten yhteydessä. Tuomalla MPA:n autoenkooderiin kirjoittaja toteuttaa joustavan lähetin-vastaanottimen, joka voi tarjota paremman yleistyksen eri käyttötilanteissa. Tämä lähestymistapa mahdollistaa karkean oppimisen harjoitusvaiheessa ja mukautuvan päättelyn päättelyvaiheessa.

Pääongelmat ratkaistu

Yleistyksen suorituskykyongelmat: Kun perinteiset autoenkooderilähetin-vastaanottimet kohtaavat satunnaisia kanavamuutoksia, koska neuronit ovat kiinteät koulutuksen päätyttyä, yleistyssuorituskyky on huono.
Mallin ja todellisen kanavan välinen poikkeama: Stokastisen gradientin laskeutumismenetelmän ja takaisinetenemisalgoritmin perusteella koulutettujen autoenkooderien käyttö perustuu rakennettuun kanavamalliin todellisen kanavan sijaan, mikä voi johtaa suorituskyvyn heikkenemiseen päättelyvaiheessa.
Sopeutuminen kanavan muutoksiin: Autoencoder globaali lähetin-vastaanotin voi aiheuttaa vastaanottimen toimintahäiriön, kun kanavan muutokset ylittävät koulutusodotukset.
Jakelun ulkopuolinen näytteiden käsittely: Satunnaiset muutokset langattomissa kanavissa johtavat jakelun ulkopuolisiin näytteisiin tai poikkeaviin arvoihin, ja olemassa olevia ratkaisuja on vaikea täyttää langattomien viestintälaitteiden alhaisen energiankulutuksen, alhaisen latenssin ja alhaisten yleiskustannusten vaatimuksiin.

päämenetelmä

Message Passing Algorithm (MPA): Otetaan käyttöön MPA-toiminto adaptiivisen säädön aikaansaamiseksi esikooderikerroksen kautta lähetin-vastaanottimen yleistyssuorituskyvyn parantamiseksi, kun kanava muuttuu dynaamisesti.
Mittasuhteita vähentävä kerros: Lisää ulottuvuuden vähennyskerros autoencoder-kehykseen, suorita lineaarinen ulottuvuuden vähennysmuunnos ja säädä mittasuhteen vähennyskerroksen kertoimia iteratiivisesti MPA:n kautta.
Itsenäinen MPA-iteraatio: Käytä eteenpäin iteraatiota (samanlainen kuin epälineaarinen tukivektorikone) ja taaksepäin iteraatiota (samanlainen kuin tarkkaavainen hermoverkko) säätääksesi itsenäisesti ulottuvuuden vähennyskerrosta ilman, että luotat alkuperäisen autoenkooderin taaksepäin etenemiseen.
globaali ketjutettu oppiminen: Sarjaharjoitusjärjestelmän avulla ulottuvuuden vähennyskerrosta ja syvää hermokerrosta koulutetaan erikseen karkean oppimisen ja mukautuvan päättelyn saavuttamiseksi.
Karkea oppiminen ja mukautuva päättely: Yksinkertaistettua kanavamallia käytetään karkeaan oppimiseen opetusvaiheessa, kun taas ulottuvuuden vähennyskerrosta säädetään MPA:n avulla päättelyvaiheessa sopeutumaan nykyiseen kanavan mittaustilanteeseen.

Näiden menetelmien avulla artikkelin tavoitteena on parantaa autoenkooderilähetin-vastaanottimien suorituskykyä ja yleistyskykyä satunnaisten kanavamuutosten yhteydessä.
Lisää kuvan kuvaus tähän
Artikkelin MPA-menetelmästä saat yleiskatsauksen katsomalla kuvia 16 ja 17.
Tärkeintä on lisätä MPA-kerros lähetysvektorin ja kanavan välisen ulottuvuuden muuntamiseksi. Sitten koulutuksen aikana MPA-kerros ensin jäädytetään. MPA-kerrosta voidaan pitää lähetyksen esikoodauksena. Erityiset mitat voidaan saada mittaamalla kanavaa. MPA-kerroksen koulutus perustuu vastaanotetun signaalin ja lähetetyn vektorin väliseen huomioimiseen.Huomio syvä hermoverkko on tehokas menetelmä kahden ominaisuuden samankaltaisuuden mittaamiseen eri ulottuvuuksien välillä . On huomattava, että huomioiden määrä on pienempi kuin vastaanotettujen signaalien määrä, eli L

Teknologian jakaminen