DigiTala: lukioissa kerätty S2-aineisto, kevät 2021
Kuvaus
Digitala-aineisto on tulossa Kielipankkiin.
Aineisto sisältää suomi toisena kielenä ja suomi toisena kotimaisena kielenä -oppimäärää opiskelleiden lukiolaisten puhenäytteitä, puhenäytteiden litteraatit sekä puhenäytteille annetut asiantuntija-arviot. Lisäksi kielivara sisältää puhujien ja arvioijien taustatiedot ja kyselyvastaukset. Aineisto on kerätty keväällä 2021 osana DigiTala-tutkimushanketta (Suomen Akatemia 2019–2023).
DigiTala-tutkimushankkeen ensisijainen tavoite oli kehittää automaattiseen puheentunnistukseen ja automaattiseen arviointiin perustuva digitaalinen sovellus, joka antaa automaattista palautetta kielen oppijan puheesta. Ensimmäiset kohdekielet olivat ruotsi ja suomi toisena/ toisena kotimaisena kielenä. Sovelluksia kehitettiin kahteen käyttötarkoitukseen. Ensinnäkin automatiikkaa hyödyntävät sovellukset mahdollistavat suullisen kielitaidon arvioimisen suurissa ja tärkeissä kielikokeissa, kuten ylioppilastutkinnon kielikokeissa. Toiseksi kielen oppijat voivat sovellusten avulla harjoitella vieraan kielen ääntämistä ja puheen tuottamista itsenäisesti koulun ulkopuolella tai opettajan ohjaamana kielten oppitunneilla.
Tutkimushankkeen aikana kerättiin suomen oppijoiden puhetta lukiolaisilta ja aikuisilta. Tässä kuvatun aineiston sekä syksyn 2021 aineiston (http://urn.fi/urn:nbn:fi:lb-2023012625) lisäksi hankkeessa käytettiin aiemman DigiTala-hankkeen (Svenska folkskolans vänner 2015-2017) lukiolaisilta keräämää ruotsin puheaineistoa (ks. http://urn.fi/urn:nbn:fi:lb-2017081502) sekä Yleisten kielitutkintojen suomen ja ruotsin kokeisiin osallistuneiden puhetta (ks. http://urn.fi/urn:nbn:fi:lb-2023012629).
Osa puheaineistosta litteroitiin. Projekti järjesti yhteensä neljä arviointikierrosta, jossa ihmisarvioijat arvioivat puhenäytteitä käyttäen hankkeen laatimia kriteerejä.
Kolmen yliopiston tutkijatiimeissä työskenteli niin kielten opetuksen, puheen- ja kielenkäsittelyn kuin fonetiikan asiantuntijoita Helsingin yliopistosta (apurahanumero 322619), Aalto-yliopistosta (apurahanumero 322625) ja Jyväskylän yliopistosta (apurahanumero 322965).
Aineiston tekijät:
Anna von Zansen, Yaroslav Getman, Milla Sneck, Heini Kallio, Ragheb Al-Ghezi, Ekaterina Voskoboinik, Maria Kautonen, Ari Huhta, Mikko Kuronen, Mikko Kurimo, Raili Hildén
Kyselylomakkeet, käytetyt tehtävät ja arviointikriteerit on julkaistu Zenodossa (https://zenodo.org/communities/digitala/).
Tietojenkäsittelytieteen opiskelijat kehittivät tilauksestamme Moodle-pluginin, joka on dokumentoituna Githubissa (https://github.com/aalto-speech/moodle-mod_digitala).
Näytä enemmänJulkaisuvuosi
2023
Aineiston tyyppi
Tekijät
Aalto-yliopisto - Tekijä
Jyväskylän yliopisto - Tekijä
Projekti
Muut tiedot
Tieteenalat
Kielitieteet
Kieli
suomi, ruotsi
Saatavuus
Saatavuutta rajoitettu