Suomi24 virkkeet -korpus 2001-2017, Korp-versio 1.2
Kuvaus
Aineisto sisältää Suomi 24 keskustelupalvelun kaikki Suomi24 APIssa saatavilla olevat keskustelupalstat ajalta 1.1.2001–31.12.2017.
Keskustelujen sisältö esitetään enintään kappaletasolla, ei kokonaisina kommentteina (viesteinä) tai kommenttiketjuina.
Tutkijat voivat myös ladata käyttöönsä koko Suomi24-aineiston Kielipankin latauspalvelusta, ks. http://urn.fi/urn:nbn:fi:lb-2020021801
Päivityksiä:
2021-04-21: Aineistosta julkaistiin päivitetty versio 1.2, jonka kuhunkin virkkeeseen on lisätty virkkeen tunnetilaa (sentiment) ilmaiseva polaarisuustieto (positiivinen, neutraali, negatiivinen). Polaarisuustieto on tuotettu luokittimella, joka on opetettu FinnSentiment-aineistolla (http://urn.fi/urn:nbn:fi:lb-2020111001; ks. myös Lindén, Jauhiainen & Hardwick, 2020).
2020-02-20: Aineistosta julkaistiin korjattu versio 1.1. Se sisältää aiemmasta versiosta vuosilta 2009–2012 ja 2014 puuttuneet kirjoittajan nimimerkkitiedot, ja kaikissa nimimerkeissä merkit ', " ja & näkyvät sellaisinaan, eivät ', " ja &. Lisäksi aineiston aikaisemman nimen osa "2017H2" korvattiin vuosivälillä "2001–2017".
Näytä enemmänJulkaisuvuosi
2020
Aineiston tyyppi
Tekijät
Aller Media Oy - Tekijä
University of Helsinki - Kuraattori
Projekti
Muut tiedot
Tieteenalat
Kielitieteet
Kieli
suomi
Saatavuus
Avoin