HUAWEI FASHION FLAIR

L’INTELLIGENZA ARTIFICIALE AL SERVIZIO DELLA CREATIVITà E DEL TALENTO UMANO
Documento a cura di Davide Bacciu, Professore del dipartimento di Computer Learning dell’ Università di Pisa e membro del comitato direttivo dell’Associazione italiana per l’intelligenza Artificiale Il cuore intelligente dell’app “Fashion Flair” è uno dei modelli di rete neurale artificiale più popolari degli ultimi anni, conosciuto con il nome di Reti Generative Avversariali, dall’inglese Generative Adversarial Networks (GAN, in breve). L’articolo scientifico che ne ha posto le basi metodologiche risale solo al 2014, eppure le GAN hanno guadagnato rapidamente un ruolo di primo piano tra i modelli più studiati e sviluppati all’interno della comunità del deep learning. Il motivo di questo successo va sicuramente ricercato nella relativa facilità con cui è possibile addestrarle a generare nuova informazione, anche complessa, in modo estremamente realistico, rendendo le predizioni sintetiche qualitativamente indistinguibili dai dati originali utilizzati per l’apprendimento. L’ambito applicativo di maggiore impatto delle GAN è certamente quello della generazione di immagini fotorealistiche. In questo senso, le immagini sintetiche generate dalla rete rappresenteranno scene stilisticamente coerenti con il contenuto degli esempi utilizzati per l’addestramento ma con caratteristiche di originalità rispetto a questi ultimi. In altre parole, le immagini generate dalla rete possono considerarsi a tutti gli effetti nuova informazione inventata dalla rete neurale artificiale. Un secondo aspetto rilevante del modello GAN è la possibilità di regolare il processo di generazione dell’informazione, controllandone sia il contenuto che gli aspetti stilistici. Nell’ambito della generazione di immagini di volti “sintetici”, ad esempio, tale abilità viene sfruttata per variare a piacimento l’età dei soggetti ritratti. Questa stessa caratteristica viene utilizzata nell’app “Fashion Flair” per controllare la generazione di modelli di abito facendone variare stile, foggia e decoro.
L’addestramento di una GAN è basato su un’intuizione semplice quanto potente. La fase di apprendimento prevede la presenza di due reti neurali artificiali, dette rispettivamente Generatore e Discriminatore. La prima ha come obiettivo la generazione di informazione sintetica realistica a partire da dato in ingresso che non è altro che un vettore di numeri casuali. La seconda, invece, viene addestrata a riconoscere se un dato presentato in input è un esempio sintetico prodotto dal Generatore oppure un esempio reale. Le due reti vengono contrapposte in un gioco di guardia e ladri dove il Discriminatore incrementa la propria abilità nell’identificare l’informazione reale rispetto a quella sintetica, costringendo il Generatore a diventare sempre più efficace nel produrre esempi realistici. Al termine dell’addestramento, viene mantenuto il solo Generatore, a cui sarà sufficiente fornire in ingresso un vettore di numeri per ottenere in risposta la corrispondente informazione sintetica. Attraverso la manipolazione di tale vettore di input, l’app “Fashion Flair” è in grado di generare immagini di abiti caratterizzati da stili sartoriali differenti.
Il processo di addestramento della GAN utilizzata dall’app “Fashion Flair” è, in realtà, più complesso. La base di partenza per l’addestramento di tale rete è una collezione di 30000 immagini di modelli di moda vintage e moderna. Su tale collezione iniziale sono state usate tecniche di AI e visione artificiale per ottimizzare la qualità delle immagini reali usate per l’apprendimento, al fine di permettere al modello Generatore di focalizzarsi sulla generazione della parte dell’immagine che ritrae l’abito, trascurando o dando minor peso possibile ad informazioni di contorno, quali lo sfondo, le caratteristiche fisiche e la posa della modella. Al fine di incrementare il numero di esempi di apprendimento disponibili, sono poi state applicate tecniche di ricolorazione e trasformazione delle immagini. Inoltre, il modello GAN utilizzato dall’app è solo un lontano parente della prima e più semplice architettura introdotta nel 2014. Si tratta infatti di una variante conosciuta come StyleGAN, introdotta dai ricercatori di NVIDIA al termine del 2018, e che al momento rappresenta lo stato dell’arte nella generazione di immagini sintetiche. Le caratteristiche più importanti della StyleGAN sono la capacità di generare immagini realistiche ad alta risoluzione (mentre in precedenza questo era possibile solo per immagini a risoluzione molto ridotta) e la possibilità di catturare gli aspetti stilistici delle immagini in specifici attributi controllabili della rete. Attraverso la manipolazione di tali attributi numerici, l’app può, in linea di principio, variare in maniera indipendente specifici aspetti stilistici degli abiti, quali colore, lunghezza, decorazioni e taglio. Il processo di addestramento delle GAN richiede calcoli intensivi, per cui è stato svolto in centri di calcolo con sistemi ad alte prestazioni e acceleratori hardware appositi. La generazione delle immagini di abiti a partire dalla GAN addestrata è, invece, gestita dall’app direttamente sul dispositivo mobile, grazie alle risorse di calcolo del processore Kirin 980 e al supporto offerto per l’esecuzione di reti neurali artificiali e per il trattamento di immagini.
L’Intelligenza Artificiale sembra destinata a rivestire un ruolo sempre più centrale nel fashion design se anche KDD, una delle conferenze scientifiche più rilevanti del settore AI, dedica dal 2016 un workshop annuale al tema delle tecnologie intelligenti al servizio della moda e del design. In questo scenario di grande interesse, “Fashion Flair” si caratterizza come il primo esempio (pubblico) di una rete neurale artificiale che viene utilizzata interattivamente da una stilista per ideare e, in ultimo, realizzare un capo di moda.

Ufficio Stampa

Spot

Categorie

Le ultime news