StyleMamba: State Space Model for Efficient Text-Driven Image Style Transfer

Julkaisuvuosi

2024

Tekijät

Wang Zijia; Liu Zhi-Song

Tiivistelmä

We present StyleMamba, an efficient image style transfer framework that translates text prompts into corresponding visual styles while preserving the content integrity of the original images. Existing text-guided stylization requires hundreds of training iterations and takes a lot of computing resources. To speed up the process, we propose a conditional State Space Model for Efficient Text-driven Image Style Transfer, dubbed StyleMamba, that sequentially aligns the image features to the target text prompts. To enhance the local and global style consistency between text and image, we propose masked and second-order directional losses to optimize the stylization direction to significantly reduce the training iterations by 5× and the inference time by 3×. Extensive experiments and qualitative evaluation confirm the robust and superior stylization performance of our methods compared to the existing baselines. Full code of this paper can be found in unmapped: uri https://github.com/OliverDOU776/StyleMamba.

Näytä enemmän

Organisaatiot ja tekijät

Lappeenrannan–Lahden teknillinen yliopisto LUT

Liu Zhisong

Julkaisutyyppi

Julkaisumuoto

Artikkeli

Emojulkaisun tyyppi

Konferenssi

Artikkelin tyyppi

Muu artikkeli

Yleisö

Tieteellinen

Vertaisarvioitu

OKM:n julkaisutyyppiluokitus

A4 Artikkeli konferenssijulkaisussa

Julkaisukanavan tiedot

Volyymi

392

Sivut

721-728

ISSN

0922-6389

ISBN

978-1-64368-548-9

Julkaisufoorumi

56381

Julkaisufoorumitaso

Avoin saatavuus

Avoin saatavuus kustantajan palvelussa

Kyllä

Julkaisukanavan avoin saatavuus

Kokonaan avoin julkaisukanava

Rinnakkaistallennettu

Muut tiedot

Tieteenalat

Tietojenkäsittely ja informaatiotieteet

Avainsanat

[object Object],[object Object],[object Object]

Kustantajan kansainvälisyys

Kansainvälinen

Kansainvälinen yhteisjulkaisu

Kyllä

Yhteisjulkaisu yrityksen kanssa

DOI

10.3233/FAIA240554

Julkaisu kuuluu opetus- ja kulttuuriministeriön tiedonkeruuseen

Kyllä

undefined

StyleMamba: State Space Model for Efficient Text-Driven Image Style Transfer

Julkaisuvuosi

Tekijät

Tiivistelmä

Organisaatiot ja tekijät Näytä tarkemmin

Julkaisutyyppi

Julkaisumuoto

Emojulkaisun tyyppi

Artikkelin tyyppi

Yleisö

Vertaisarvioitu

OKM:n julkaisutyyppiluokitus

Julkaisukanavan tiedot

Emojulkaisun nimi

Konferenssi

Kustantaja

Volyymi

Sivut

ISSN

ISBN

Julkaisu­foorumi

Julkaisufoorumitaso

Avoin saatavuus

Avoin saatavuus kustantajan palvelussa

Julkaisukanavan avoin saatavuus

Rinnakkaistallennettu

Muut tiedot

Tieteenalat

Avainsanat

Kustantajan kansainvälisyys

Kansainvälinen yhteisjulkaisu

Yhteisjulkaisu yrityksen kanssa

DOI

Julkaisu kuuluu opetus- ja kulttuuriministeriön tiedonkeruuseen

Organisaatiot ja tekijät

Julkaisufoorumi