Suomen kielen näytteitä, ladattava versio
Kuvaus
Tämä korpus on ladattavissa Kielipankista.
Suomen kielen näytteitä -korpus eli SKN-korpus perustuu Kotimaisten kielten keskuksen vuosina 1978–2000 julkaisemaan samannimiseen murrekirjasarjaan (ks. Suomen kielen näytteitä). Yhteensä ilmestyi 50 kirjasta, joissa jokaisessa on litteroituna noin kaksi tuntia murretta. Sarjaan valitut pitäjät edustavat kattavasti eri murrealueita. Aineistona ovat olleet pääasiassa Suomen kielen nauhoitearkiston äänitteet. Alkuperäisestä SKN-sarjasta luotiin korpus, joka sisältää sekä äänitteet että niihin kohdistetun litteroidun tekstin. Korpus on jaettu viiteenkymmeneen osaan paikkakunnan ja aiemmin julkaistujen murrekirjojen mukaan. Kustakin osasta on yleensä saatavilla kaksi murrenäytettä.
Tässä ladattavassa korpusversiossa on murrehaastattelujen äänitiedostot, annotaatiotiedostot sekä murrekirjojen paikkakuntakohtaiset saatetekstit. Korpus on sisällöltään sama kuin se aineisto, joka oli käytettävissä vuoteen 2020 saakka Kielipankin LAT-palvelussa. Lisätietoja SKN-korpuksen eri versioista löydät SKN-aineistoryhmän tietosivulta (https://www.kielipankki.fi/aineistot/skn).
HUOMAUTUS: ladattavat aineistot paketoitiin uudelleen 31.01.2023, koska aiemmista paketeista oli jäänyt puuttumaan tietoja.
Korjauksen yhteydessä lisättiin seuraavat tiedot:
- Neljä saatetekstiä kirjasarjan yksittäisille osille pdf-muodossa
- PDF-tiedostoja, joissa on yleistietoa kustakin 50 kunnasta
- wav-äänitiedostot kunnille 9-14
Näytä enemmänJulkaisuvuosi
2021
Aineiston tyyppi
Tekijät
Helsingin yliopisto - Julkaisija
User support FIN-CLARIN - Kuraattori
Kotimaisten kielten keskus - Oikeuksienhaltija, Tekijä
Projekti
Muut tiedot
Tieteenalat
Kielitieteet
Kieli
suomi
Saatavuus
Avoin