Tehokas ja periaatteellinen moniagentti vahvistusoppiminen

Rahoitetun hankkeen kuvaus

Vahvistusoppiminen on lupaava lähestymistapa sellaisten järjestelmien optimointiin joissa on monta toimijaa (agenttia). Tälläisiä moniagentti-järjestelmiä voivat muodostaa esimerkiksi yhteistyötä tekevät robotit tai langattomat laitteet. Tämän projektin tavoite on lisätä ymmärrystä siitä, kuinka hallita oppimista moniagentti-järjestelmissä. Oppimisen pitää olla nopeaa, mutta samalla päätyä tarkkaan lopputulokseen. Erityisesti tämä projekti: (i) Yrittää välttää turhan tiedon keräämistä tutkimalla uusia laskennallisia malleja tulevien tapahtumien ennustamiseksi. (ii) Kehittää uusia menetelmiä tarkoituksena helpottaa laskentaa merkittävästi. Uudet menetelmät aloittavat oppimisen helpoista tehtävistä ja automaattisesti siirtyvät kohti vaikeaa varsinaista tehtävää. (iii) Edistää suunnittelumenetelmiä, jotka etukäteen arvioivat mikä tieto on arvokasta sekä laskennallisten mallien oppimiseen, että agenttien toiminnan parantamiseen.
Näytä enemmän

Aloitusvuosi

2023

Päättymisvuosi

2027

Myönnetty rahoitus

Joni Pajarinen Orcid -palvelun logo
474 091 €

Rahoittaja

Suomen Akatemia

Rahoitusmuoto

Akatemiahanke

Muut tiedot

Rahoituspäätöksen numero

357301

Tieteenalat

Tietojenkäsittely ja informaatiotieteet

Tutkimusalat

Tietojenkäsittelytieteet

Tunnistetut aiheet

artificial intelligence, machine learning