Clotho Analysis Set

Kuvaus

This dataset is derived from the evaluation subset of Clotho dataset (https://zenodo.org/doi/10.5281/zenodo.3490683). It is designed to analyze the behavior of the captioning system under certain perturbation in order to try and identify some open challenges in automated audio captioning. The original audio clips are transformed with audio_degrader. The transformations applied are the following: Microphone response simulation Mixup with another clip from the dataset (ratio -6dB, -3dB and 0dB) Additive noise from DESED (ratio -12dB, -6dB, 0dB)
Näytä enemmän

Julkaisuvuosi

2022

Aineiston tyyppi

Tekijät

Huang Xie - Tekijä

Konstantinos Drossos - Tekijä

Samuel Lipping - Tekijä

Tuomas Virtanen - Tekijä

Tuntematon organisaatio

Felix Gontier - Tekijä

Romain Serizel - Tekijä

Zenodo - Julkaisija

Projekti

Muut tiedot

Tieteenalat

Tietojenkäsittely ja informaatiotieteet

Kieli

englanti

Saatavuus

Avoin

Lisenssi

Creative Commons Nimeä 4.0 Kansainvälinen (CC BY 4.0)

Avainsanat

Computer and information sciences

Asiasanat

Ajallinen kattavuus

undefined

Liittyvät aineistot