AthenaRL: Skaalautuvat ja joustavat hajautetut vahvistusoppimisjärjestelmät
Rahoitetun hankkeen kuvaus
Vahvistusoppimisella (RL) on saavutettu merkittäviä tuloksia käytännön sovelluksissa. Haasteena on suunnitella ohjelmistojärjestelmiä, jotka kykenevät kouluttamaan RL-malleja erittäin suuressa mittakaavassa. Esimerkiksi suositun chatbotin, ChatGPT, perustana olevan suuren kielimallin (GPT-4) kouluttaminen edellyttää mallin ja tietojen jakamista kymmenien tuhansien erikoislaitteistojen ja grafiikkasuorittimien (GPU) välillä. Tämän seurauksena tavallisten käyttäjien sekä pienten ja keskisuurten yritysten on vaikeaa tai jopa mahdotonta soveltaa nykyaikaisia RL-malleja liiketoiminnassaan. Tässä Aalto-yliopistossa toteutetussa hankkeessa suunnittelemme ja toteutamme teollisessa mittakaavassa skaalautuvan ja joustavan RL-malli, AthenaRL. AthenaRL tulee olemaan avoimen lähdekoodin ohjelmisto, jossa on helppokäyttöiset rajapinnat ja päästä päähän -julkaisuputki. Käyttäjät voivat näin ollen suoraan käyttää tai mukauttaa AthenaRL:ää omien alojensa ongelmien ratkaisemiseen.
Näytä enemmänAloitusvuosi
2024
Päättymisvuosi
2028
Myönnetty rahoitus
Rahoittaja
Suomen Akatemia
Rahoitusmuoto
Akatemiahanke
Päättäjä
Luonnontieteiden ja tekniikan tutkimuksen toimikunta
13.06.2024
13.06.2024
Muut tiedot
Rahoituspäätöksen numero
362729
Tieteenalat
Tietojenkäsittely ja informaatiotieteet
Tutkimusalat
Ohjelmistotekniikka, käyttöjärjestelmät, ihminen-kone -vuorovaikutus
Tunnistetut aiheet
computer science, information science, algorithms