Tekstin uudelleenkäyttöklusterit ruotsinkielisessä lehdistössä 1645-1918

Kuvaus

Tämä aineisto on tulossa saataville Kielipankkiin. Aineisto perustuu tutkimukseen, jossa etsittiin Suomen ja Ruotsin kansalliskirjastojen digitoimista ruotsinkielisistä sanoma- ja aikakauslehtiaineistoista päällekkäisyyksiä, tekstien toistoja. Ajatuksena oli paikantaa kaikki vähintään kerran toistetut tai kopioidut, yli 300 merkkiä pitkät tekstit tai tekstifragmentit. Näitä samuuksia tai päällekkäisyyksiä löytyi yli 101 miljoonaa. Kun samat tekstit yhdistettiin klustereiksi, klustereita muodostui lähes 22 miljoonaa. Tutkimus kattoi vuodet 1645-1918. Aikarajauksen alkuna oli ensimmäinen Ruotsissa painettu sanomalehti. Yhteensä digitoitua sanomalehtiaineistoa oli käytössä 7,5 miljoonaa sivua. Suomessa ja Ruotsissa painetun lehdistön lisäksi aineisto sisälsi Pohjois-Amerikassa julkaistuja ruotsinkielisiä siirtolaislehtiä. Aineiston on tuottanut Svenska Litteratursällskapet i Finlandin rahoittama hanke "Informationsflöden över Östersjön: Svenskspråkig press som kulturförmedlare". Digitoitu aineisto koottiin marraskuussa 2022.
Näytä enemmän

Julkaisuvuosi

2023

Aineiston tyyppi

Tekijät

University of Helsinki - Kuraattori

University of Turku

Hannu Salmi Orcid -palvelun logo - Kuraattori

Projekti

Muut tiedot

Tieteenalat

Kielitieteet

Kieli

ruotsi

Saatavuus

Avoin

Lisenssi

Creative Commons Nimeä 4.0 Kansainvälinen (CC BY 4.0)

Avainsanat

Asiasanat

Ajallinen kattavuus

undefined

Liittyvät aineistot