AthenaRL: Skaalautuvat ja joustavat hajautetut vahvistusoppimisjärjestelmät

Rahoitetun hankkeen kuvaus

Vahvistusoppimisella (RL) on saavutettu merkittäviä tuloksia käytännön sovelluksissa. Haasteena on suunnitella ohjelmistojärjestelmiä, jotka kykenevät kouluttamaan RL-malleja erittäin suuressa mittakaavassa. Esimerkiksi suositun chatbotin, ChatGPT, perustana olevan suuren kielimallin (GPT-4) kouluttaminen edellyttää mallin ja tietojen jakamista kymmenien tuhansien erikoislaitteistojen ja grafiikkasuorittimien (GPU) välillä. Tämän seurauksena tavallisten käyttäjien sekä pienten ja keskisuurten yritysten on vaikeaa tai jopa mahdotonta soveltaa nykyaikaisia RL-malleja liiketoiminnassaan. Tässä Aalto-yliopistossa toteutetussa hankkeessa suunnittelemme ja toteutamme teollisessa mittakaavassa skaalautuvan ja joustavan RL-malli, AthenaRL. AthenaRL tulee olemaan avoimen lähdekoodin ohjelmisto, jossa on helppokäyttöiset rajapinnat ja päästä päähän -julkaisuputki. Käyttäjät voivat näin ollen suoraan käyttää tai mukauttaa AthenaRL:ää omien alojensa ongelmien ratkaisemiseen.
Näytä enemmän

Aloitusvuosi

2024

Päättymisvuosi

2028

Myönnetty rahoitus

Bo Zhao Orcid -palvelun logo
546 079 €

Rahoittaja

Suomen Akatemia

Rahoitusmuoto

Akatemiahanke

Päättäjä

Luonnontieteiden ja tekniikan tutkimuksen toimikunta
13.06.2024

Muut tiedot

Rahoituspäätöksen numero

362729

Tieteenalat

Tietojenkäsittely ja informaatiotieteet

Tutkimusalat

Ohjelmistotekniikka, käyttöjärjestelmät, ihminen-kone -vuorovaikutus

Tunnistetut aiheet

computer science, information science, algorithms