Tehokas ja periaatteellinen moniagentti vahvistusoppiminen
Rahoitetun hankkeen kuvaus
Vahvistusoppiminen on lupaava lähestymistapa sellaisten järjestelmien optimointiin joissa on monta toimijaa (agenttia). Tälläisiä moniagentti-järjestelmiä voivat muodostaa esimerkiksi yhteistyötä tekevät robotit tai langattomat laitteet. Tämän projektin tavoite on lisätä ymmärrystä siitä, kuinka hallita oppimista moniagentti-järjestelmissä. Oppimisen pitää olla nopeaa, mutta samalla päätyä tarkkaan lopputulokseen. Erityisesti tämä projekti: (i) Yrittää välttää turhan tiedon keräämistä tutkimalla uusia laskennallisia malleja tulevien tapahtumien ennustamiseksi. (ii) Kehittää uusia menetelmiä tarkoituksena helpottaa laskentaa merkittävästi. Uudet menetelmät aloittavat oppimisen helpoista tehtävistä ja automaattisesti siirtyvät kohti vaikeaa varsinaista tehtävää. (iii) Edistää suunnittelumenetelmiä, jotka etukäteen arvioivat mikä tieto on arvokasta sekä laskennallisten mallien oppimiseen, että agenttien toiminnan parantamiseen.
Näytä enemmänAloitusvuosi
2023
Päättymisvuosi
2027
Myönnetty rahoitus
Muut tiedot
Rahoituspäätöksen numero
357301
Tieteenalat
Tietojenkäsittely ja informaatiotieteet
Tutkimusalat
Tietojenkäsittelytieteet
Tunnistetut aiheet
artificial intelligence, machine learning