Rakenteellinen virheettömyys metagenomien kokoamisessa

Rahoitetun hankkeen kuvaus

Sekvensointidatan määrä on kasvanut valtavasti viimeisen vuosikymmenen aikana. Jotta tätä dataa voitaisiin analysoida tehokkaasti, se täytyy koota genomeiksi tai esittää kompaktisti. Nykyiset työkalut, jotka kokoavat genomeja tai esittävät sekvensointidatan kompaktisti, tuottavat vain joukon sekvenssejä ilman arvioita sekvenssien oikeellisuudesta, mikä vaikeuttaa jatkoanalyysien oikeellisuuden arviointia. Me kehitämme malleja, jotka arvioivat koottujen sekvenssien oikeellisuutta. Me tuotamme näiden sekvenssien jokaiselle alimerkkijonolle arvion siitä todennäköisyydestä, että kyseinen alimerkkijono esiintyy sekvensoidussa näytteessä. Me tarkastelemme yhden genomin tai useamman genomin sekoituksen kokoamista ja sekvensointidatan kompaktia esittämistä. Menetelmiemme ansiosta on mahdollista analysoida tarkasti genomisten analyysien oikeellisuutta ja kohdistaa validointia koottujen sekvenssien epävarmoille alueille.
Näytä enemmän

Aloitusvuosi

2025

Päättymisvuosi

2029

Myönnetty rahoitus

Leena Salmela Orcid -palvelun logo
599 999 €

Rahoittaja

Suomen Akatemia

Rahoitusmuoto

Akatemiahanke

Päättäjä

Luonnontieteiden ja tekniikan tutkimuksen toimikunta
12.06.2025

Muut tiedot

Rahoituspäätöksen numero

370538

Tieteenalat

Biolääketieteet

Tutkimusalat

Systeemibiologia, bioinformatiikka

Tunnistetut aiheet

genes, genetics