Suomi24-korpus 2001-2020, VRT-versio 1.1 (julkaisuehdokas)

Kuvaus

The corpus is available for download in Kielipankki - the Language Bank of Finland. Please note that the corpus is a release candidate, so it may still change. This collection contains two downloadable sets of Suomi24 data: "The Suomi24 Corpus 2001-2017, VRT version" and "The Suomi24 Corpus 2018-2020, VRT version". Together, the two corpora cover all the discussion forums of the Suomi24 online social networking website from 1st January 2001 to 31st December 2020. Updates: 2025-04-14: For version 1.1 the data has been updated with annotations of names recognized with FiNER 1.6 and languages of sentences identified with HeLI-OTS 2.0.
Näytä enemmän

Julkaisuvuosi

2021

Aineiston tyyppi

Tekijät

City Digital Group - Tekijä

Helsingin yliopisto - Julkaisija

User support FIN-CLARIN - Kuraattori

Projekti

Muut tiedot

Tieteenalat

Kielitieteet

Kieli

suomi

Saatavuus

Saatavuutta rajoitettu

Lisenssi

CLARIN ACA+NC (Academic, Non Commercial) End User License 1.0

Avainsanat

Asiasanat

Ajallinen kattavuus

undefined

Liittyvät aineistot