Lahjoita puhetta semisupervised baseline Kaldi ASR model

Kuvaus

Lahjoita puhetta semisupervised baseline speech recognition model, built with the Kaldi toolkit. Trained on 100 hours of supervised and approx. 1600 hours of untranscribed Finnish speech. Described in more detail in the paper https://arxiv.org/abs/2203.12906 "Lahjoita puhetta – a large-scale corpus of spoken Finnish with some benchmarks". For details on the training method, see https://github.com/aalto-speech/lahjoita-puhetta-baseline-kaldi.
Näytä enemmän

Julkaisuvuosi

2022

Aineiston tyyppi

Tekijät

Department of Signal Processing & Acoustics

Tamás Grósz Orcid -palvelun logo - Tekijä

Zenodo - Julkaisija

Projekti

Muut tiedot

Tieteenalat

Tietojenkäsittely ja informaatiotieteet

Kieli

Saatavuus

Avoin

Lisenssi

Creative Commons Nimeä 4.0 Kansainvälinen (CC BY 4.0)

Avainsanat

Ajallinen kattavuus

undefined

Liittyvät aineistot