Clotho dataset

Kuvaus

Clotho is a novel audio captioning dataset, consisting of 4981 audio samples, and each audio sample has five captions (a total of 24 905 captions). Audio samples are of 15 to 30 s duration and captions are eight to 20 words long.
Näytä enemmän

Julkaisuvuosi

2021

Aineiston tyyppi

Tekijät

Konstantinos Drosos - Tekijä

Samuel Lipping - Tekijä

Tuomas Virtanen - Tekijä

Zenodo - Julkaisija

Projekti

Muut tiedot

Tieteenalat

Tietojenkäsittely ja informaatiotieteet

Kieli

englanti

Saatavuus

Avoin

Lisenssi

muu

Avainsanat

Computer and information sciences

Asiasanat

Ajallinen kattavuus

undefined

Liittyvät aineistot