Clotho Analysis Set
Kuvaus
This dataset is derived from the evaluation subset of Clotho dataset (https://zenodo.org/doi/10.5281/zenodo.3490683). It is designed to analyze the behavior of the captioning system under certain perturbation in order to try and identify some open challenges in automated audio captioning. The original audio clips are transformed with audio_degrader. The transformations applied are the following: Microphone response simulation Mixup with another clip from the dataset (ratio -6dB, -3dB and 0dB) Additive noise from DESED (ratio -12dB, -6dB, 0dB)
Näytä enemmänJulkaisuvuosi
2022
Aineiston tyyppi
Tekijät
Huang Xie - Tekijä
Konstantinos Drossos - Tekijä
Samuel Lipping - Tekijä
Tuomas Virtanen - Tekijä
Tuntematon organisaatio
Felix Gontier - Tekijä
Romain Serizel - Tekijä
Zenodo - Julkaisija
Projekti
Muut tiedot
Tieteenalat
Tietojenkäsittely ja informaatiotieteet
Kieli
englanti
Saatavuus
Avoin