Finnish News Corpus for Named Entity Recognition

Kuvaus

The corpus consists of 953 articles (193,742 word tokens) with six named entity classes (organization, location, person, product, event,and date). The articles are extracted from the archives of Digitoday, a Finnish online technology news source. The data sets are available at https://github.com/mpsilfve/finer-data and will be available in the download service korp.csc.fi/download in Kielipankki – the Language Bank of Finland. The FiNER system and its technical documentation are available at http://urn.fi/urn:nbn:fi:lb-2018091301
Näytä enemmän

Julkaisuvuosi

2019

Aineiston tyyppi

Tekijät

University of Helsinki - Kuraattori, Tekijä

Projekti

Muut tiedot

Tieteenalat

Kielitieteet

Kieli

suomi

Saatavuus

Avoin

Lisenssi

Creative Commons Nimeä EiKaupallinen EiMuutoksia 4.0 Kansainvälinen (CC BY NC ND 4.0)

Avainsanat

Asiasanat

Ajallinen kattavuus

undefined

Liittyvät aineistot