StyleMamba: State Space Model for Efficient Text-Driven Image Style Transfer
Julkaisuvuosi
2024
Tekijät
Wang Zijia; Liu Zhi-Song
Tiivistelmä
We present StyleMamba, an efficient image style transfer framework that translates text prompts into corresponding visual styles while preserving the content integrity of the original images. Existing text-guided stylization requires hundreds of training iterations and takes a lot of computing resources. To speed up the process, we propose a conditional State Space Model for Efficient Text-driven Image Style Transfer, dubbed StyleMamba, that sequentially aligns the image features to the target text prompts. To enhance the local and global style consistency between text and image, we propose masked and second-order directional losses to optimize the stylization direction to significantly reduce the training iterations by 5× and the inference time by 3×. Extensive experiments and qualitative evaluation confirm the robust and superior stylization performance of our methods compared to the existing baselines. Full code of this paper can be found in unmapped: uri https://github.com/OliverDOU776/StyleMamba.
Näytä enemmänOrganisaatiot ja tekijät
Julkaisutyyppi
Julkaisumuoto
Artikkeli
Emojulkaisun tyyppi
Konferenssi
Artikkelin tyyppi
Muu artikkeli
Yleisö
TieteellinenVertaisarvioitu
VertaisarvioituOKM:n julkaisutyyppiluokitus
A4 Artikkeli konferenssijulkaisussaJulkaisukanavan tiedot
Emojulkaisun nimi
Kustantaja
Volyymi
392
Sivut
721-728
ISSN
ISBN
Julkaisufoorumi
Julkaisufoorumitaso
1
Avoin saatavuus
Avoin saatavuus kustantajan palvelussa
Kyllä
Julkaisukanavan avoin saatavuus
Kokonaan avoin julkaisukanava
Rinnakkaistallennettu
Ei
Muut tiedot
Tieteenalat
Tietojenkäsittely ja informaatiotieteet
Avainsanat
[object Object],[object Object],[object Object]
Kustantajan kansainvälisyys
Kansainvälinen
Kansainvälinen yhteisjulkaisu
Kyllä
Yhteisjulkaisu yrityksen kanssa
Ei
DOI
10.3233/FAIA240554
Julkaisu kuuluu opetus- ja kulttuuriministeriön tiedonkeruuseen
Kyllä