2024-07-11
한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina
En mene tässä liian yksityiskohtiin itse tekoälystä, vaan keskityn enemmän ylemmän tason sovelluksiin.
Kun puhumme suuresta kielimallista, tarkoitamme ohjelmistoa, joka voi "puhua" samalla tavalla kuin ihmisen kieli.Nämä mallit ovat hämmästyttäviä – ne pystyvät ottamaan kontekstin ja luomaan vastauksia, jotka eivät ole vain johdonmukaisia, vaan myös tuntuvat olevan peräisin oikeilta ihmisiltä.
Nämä kielimallit toimivat analysoimalla suuria määriä tekstidataa ja oppimismalleja kielenkäytössä.He hyödyntävät näitä malleja luodakseen tekstiä, joka on lähes erottamaton siitä, mitä ihmiset sanovat tai kirjoittavat.
Jos olet joskus keskustellut virtuaalisen avustajan kanssa tai ollut vuorovaikutuksessa tekoälyn asiakaspalvelun kanssa, olet luultavasti ollut vuorovaikutuksessa suuren kielimallin kanssa tietämättäsi. Näissä malleissa on laaja valikoima sovelluksia chatboteista kielten kääntämiseen sisältöön luominen ja paljon muuta
Miksi minun pitää avata erillinen luku suurten kielimallien "ymmärtämiseksi", kun olen saanut yleiskatsauksen suurista kielimalleista, koska sen avulla tiedät paremmin, mikä suuri kielimalli on, ymmärrät sen ylärajan ja osaat myös helpottaa sovelluskerroksen tekemistä paremmin.
Ensinnäkin voimme sanoa yleisesti, että koneoppimisen tarkoituksena on löytää erityinen monimutkainen "toiminto", joka voi muuttaa syötteemme halutuksi tuotokseksi. Jos esimerkiksi odotamme syöttävän tulon 1 ja lähdön 5 tuloon 2 ja ulostuloon 10, tämä funktio voi olla y=2*x.Tai jos syötämme kuvan kissasta, haluan sen kirjoittavan sanan "kissa", tai jos syötän "hei", se tulostaa "hei" jne.
Itse asiassa tätä voidaan pitää pohjimmiltaan matemaattisena ongelmana. Varsinainen ongelma on tietysti paljon monimutkaisempi kuin yllä oleva esimerkki.
1. Alkuaikoina ihmiset halusivat aina saada koneet ajattelemaan ihmisten tavoin. Tuolloin ihmiset mainostivat lähinnä "lintulentokoulua". Sitten he toivoivat saavansa koneet ajattelemaan samoin. Mutta tämä vaikutus ei ole kovin hyvä. "Maailmatieto on oletustietoa aivoissasi, joka on tunnettua ja vaistomaista, esimerkiksi "vesi virtaa alaspäin". on massiivinen, ja useiden merkityksien ongelmaa on vaikea ratkaista yhdellä sanalla.Yleisesti ottaen se on liian monimutkaista jäljittelemään ihmisaivoja, ja sitä on vaikea saavuttaa pelkällä koodilla ja funktioilla.
2. Tekoäly 2.0:n aikakausi: "tilastopohjaisen tekoälyn" datalähtöinen toteutus. Miksi kaikenlaisia suuria malleja on syntynyt kuin sieniä sateen jälkeen GPT3:n syntymisen jälkeen? Itse asiassa suurin osa yrityksistä on tutkinut tekoälyä pitkään, mutta alkuaikoina kaikki ylittivät joen kiviä tuntemalla. Vaikka suunnitelmia ja ajatuksia oli monia, he eivät uskaltaneet lisätä investointejaan studiin ne kaikki olivat rajoitetun tutkimuksen piirissä. GPT3:n syntyminen antoi kaikille mahdollisuuden nähdä, että tietty menetelmä on käyttökelpoinen, eli valtavien tietomäärien käyttäminen tilastojen laskemiseen. Määrän muutokset johtavat siis laadullisiin muutoksiin Aloitti Lisää investointeja ja valitse tämä tie
3. Big data voi tehdä koneälyn tason harppauksen eteenpäin suurten tietomäärien käytön suurin merkitys on sallia tietokoneiden suorittaa asioita, joita vain ihmiset pystyivät aiemmin tekemään.
Joten ongelman avaimesta tulee todennäköisyyskysymys. Tällä hetkellä suuret mallit laskevat todennäköisyyden massiivisista tiedoista määrittääkseen suurimman todennäköisyyden seuraavalle tekstille tai tietylle tekstikappaleelle keskellä, ja tulostavat sen sitten.Itse asiassa ydin ei ole luoda uusia asioita, vaan järkeä.
Kysy häneltä esimerkiksi missä on Kiinan pääkaupunki?Algoritmin avulla poimittu avainsana on, että Kiinan pääkaupunki on
Sitten suuri malli laskee massiivisista tiedoista, että Kiinan pääkaupunki on todennäköisin sana, jota seuraa Peking, joten se antaa oikean tuloksen.
Suuret mallit luottavat valtavien tietomäärien "rote-oppimiseen" nykyisten ominaisuuksien saavuttamiseksi.
Siksi myös suurten mallien koulutuksessa datan laatu on erittäin kriittinen. Samalla voimme melkein ajatella suurten mallien ylärajaa.
AIGC tai tekoälyn luoma sisältö on tekniikka, joka käyttää koneoppimisalgoritmeja luomaan automaattisesti erityyppistä sisältöä, mukaan lukien tekstiä, kuvia, ääntä ja videota. Analysoimalla suuria tietomääriä AIGC-järjestelmät oppivat kieltä, visuaalisia ja äänimalleja luodakseen uutta sisältöä, joka on samanlaista tai jopa erottamatonta ihmisen luomasta sisällöstä.
"Isot mallit" kumoavat todennäköisesti kaiken digitaalisen työn
Suurin osa nykyisestä sovelluskerrostyöstämme kuuluu AIGC-järjestelmään
GPT3.5:n jälkeen isot mallit voivat jo käyttää työkaluja.
• Laajennukset ja verkostoituminen: korjaa itse suuren mallin muistin puute, mikä merkitsee työkalujen käytön oppimisen virallista alkua.
• Toiminto: LLM oppii kutsumaan sovellusliittymiä monimutkaisten tehtävien suorittamiseen, mikä on tausta-insinöörien päätehtävä (anna Gorillalle ohjeita ja se kutsuu automaattisesti malleja, kuten diffuusiota, toteuttaakseen multimodaalisia tehtäviä, kuten piirtämistä ja dialogia)
• Anna mallin "ajatella": ohjaa suuria malleja saamaan loogisia ominaisuuksia, ydin on: "Planning Memory Tool"
Itse asiassa tekoälyprojektien toteuttaminen on samaa kuin tavallisten projektien perustamisen ytimenä on oltava se, että ymmärretään selkeästi ydinongelmat, jotka projektilla on tarkoitus ratkaista, ja sitten laajentaa ajattelua ja sitten toteuttaa. kysyntäanalyysi, teknologian valinta jne.Emme ole kovin hyviä suunnittelemaan suuria malleja sovelluskerrokseen. Kutsumme yleensä suoraan API:ita tai otamme käyttöön paikallisia avoimen lähdekoodin suuria malleja.
Jokainen, joka on ollut vähänkin tekemisissä tekoälyn kanssa, saattaa tietää, että vuosina 2022-2023 alustava tekoälytutkimus perustuu edelleen tähän, eli kuinka tehdä kysymyksiä, jotta tekoäly ymmärtäisi paremmin, kiinnitä huomiota avaimeen. pisteitä ja anna sitten laadukkaampia vastauksia
Kynnys on suhteellisen matala, ja useimmat suuret mallisovellukset on suunniteltu kehotteen avulla.Joidenkin tarpeiden täyttäminen riippuu perusmallin kyvyistä
RAG (Retrieval-Augmented Generation) on tekoälyteknologia, joka yhdistää hakumalleja ja sukupolvimalleja. Se parantaa suurten kielimallien (LLM) vastausominaisuuksia hakemalla oleellista tietoa tietokannasta tai tietokannasta ja yhdistämällä sen käyttäjien kyselyihin. RAG-teknologia voi parantaa tekoälysovellusten tarkkuutta ja relevanssia erityisesti skenaarioissa, jotka koskevat tiettyä verkkotuntia tai vaativat uusinta tietoa.
RAG:n toimintaperiaate sisältää pääasiassa kaksi vaihetta:
Tämä kynnys on kuitenkin suhteellisen korkea, ja laskentateholle, datalle ja algoritmeille on tiettyjä vaatimuksia.
Tavoite: Suorita toteutettavuuden todentaminen, suunnittele prototyyppi liiketoimintavaatimusten perusteella ja rakenna PromptFlow testataksesi keskeisiä oletuksia
Tavoite: Arvioi ratkaisujen kestävyyttä suuremmassa valikoimassa tietojoukkoja ja paranna mallin suorituskykyä tekniikoilla, kuten hienosäätö (SFT) ja haku lisätty sukupolvi (RAG)
Tavoite: Varmistaa AIGC-järjestelmän vakaan toiminnan, integroida valvonta- ja hälytysjärjestelmät sekä saavuttaa jatkuva integrointi ja jatkuva käyttöönotto (CI/CD)
Pääsisältökatkelmat ovat tekstiperustaa, jota käytetään yhdessä ohjeiden kanssa niiden tehokkuuden lisäämiseksi.
Erityiset menetelmät pääsisällön saavuttamiseksi, mukaan lukien:
Näyttämällä mallille, kuinka tuotos muodostetaan annettujen ohjeiden perusteella, malli pystyy päättelemään tuloskuvioita, olivatpa ne nolla-, kerta- tai muutaman otoksen oppimista.
Antamalla vihjeitä suurille malleille, jotka ohjaavat niitä loogiseen päättelyyn selkeään suuntaan, se on samanlainen kuin vaiheittaisen kaavan tarjoaminen, joka auttaa mallia vähitellen saamaan vastauksen.
Mallien arvo on kirjastojen luomisessa ja julkaisemisessa tietyille sovellusalueille, jotka on optimoitu tiettyä kontekstia tai sovelluksen esimerkkiä varten.
# 职位描述:数据分析助手
## 角色
我的主要目标是为用户提供专家级的数据分析建议。利用详尽的数据资源,告诉我您想要分析的股票(提供股票代码)。我将以专家的身份,为您的股票进行基础分析、技
术分析、市场情绪分析以及宏观经济分析。
## 技能
### 技能1:使用Yahoo Finance的'Ticker'搜索股票信息
### 技能2:使用'News'搜索目标公司的最新新闻
### 技能3:使用'Analytics'搜索目标公司的财务数据和分析
## 工作流程
询问用户需要分析哪些股票,并按顺序执行以下分析:
**第一部分:基本面分析:财务报告分析
*目标1:对目标公司的财务状况进行深入分析。
*步骤:
1. 确定分析对象: