Suomen kielen näytteitä, ladattava versio

Kuvaus

Tämä korpus on ladattavissa Kielipankista. Suomen kielen näytteitä -korpus eli SKN-korpus perustuu Kotimaisten kielten keskuksen vuosina 1978–2000 julkaisemaan samannimiseen murrekirjasarjaan (ks. Suomen kielen näytteitä). Yhteensä ilmestyi 50 kirjasta, joissa jokaisessa on litteroituna noin kaksi tuntia murretta. Sarjaan valitut pitäjät edustavat kattavasti eri murrealueita. Aineistona ovat olleet pääasiassa Suomen kielen nauhoitearkiston äänitteet. Alkuperäisestä SKN-sarjasta luotiin korpus, joka sisältää sekä äänitteet että niihin kohdistetun litteroidun tekstin. Korpus on jaettu viiteenkymmeneen osaan paikkakunnan ja aiemmin julkaistujen murrekirjojen mukaan. Kustakin osasta on yleensä saatavilla kaksi murrenäytettä. Tässä ladattavassa korpusversiossa on murrehaastattelujen äänitiedostot, annotaatiotiedostot sekä murrekirjojen paikkakuntakohtaiset saatetekstit. Korpus on sisällöltään sama kuin se aineisto, joka oli käytettävissä vuoteen 2020 saakka Kielipankin LAT-palvelussa. Lisätietoja SKN-korpuksen eri versioista löydät SKN-aineistoryhmän tietosivulta (https://www.kielipankki.fi/aineistot/skn). HUOMAUTUS: ladattavat aineistot paketoitiin uudelleen 31.01.2023, koska aiemmista paketeista oli jäänyt puuttumaan tietoja. Korjauksen yhteydessä lisättiin seuraavat tiedot: - Neljä saatetekstiä kirjasarjan yksittäisille osille pdf-muodossa - PDF-tiedostoja, joissa on yleistietoa kustakin 50 kunnasta - wav-äänitiedostot kunnille 9-14
Näytä enemmän

Julkaisuvuosi

2021

Aineiston tyyppi

Tekijät

Helsingin yliopisto - Julkaisija

User support FIN-CLARIN - Kuraattori

Kotimaisten kielten keskus - Oikeuksienhaltija, Tekijä

Projekti

Muut tiedot

Tieteenalat

Kielitieteet

Kieli

suomi

Saatavuus

Avoin

Lisenssi

Creative Commons Nimeä 1.0 Yleinen (CC BY 1.0)

Avainsanat

Asiasanat

Ajallinen kattavuus

undefined

Liittyvät aineistot