Clotho dataset
Kuvaus
Clotho is a novel audio captioning dataset, consisting of 4981 audio samples, and each audio sample has five captions (a total of 24 905 captions). Audio samples are of 15 to 30 s duration and captions are eight to 20 words long.
Näytä enemmänJulkaisuvuosi
2021
Aineiston tyyppi
Tekijät
Konstantinos Drosos - Tekijä
Samuel Lipping - Tekijä
Tuomas Virtanen - Tekijä
Zenodo - Julkaisija
Projekti
Muut tiedot
Tieteenalat
Tietojenkäsittely ja informaatiotieteet
Kieli
englanti
Saatavuus
Avoin