Ai, breve guida per scrivere prompt e generare immagini sorprendenti
Occorre studiare la grammatica del prompt: le descrizioni in linguaggio naturale che vengono tradotte in immagini richiedono saperi multidisciplinari
di Luca Tremolada
3' di lettura
La premessa è ormai diventata d’obbligo e forse non ce n’è ragione ma è bene farla per evitare critiche. Allo stato dell’arte l’intelligenza artificiale generativa non è in grado da solo di sostituire un designer, un grafico e un illustratore. Allo stato dell’arte, è bene ribadire, e probabilmente mai. Sono strumenti che accelerano i tempi quando hai una idea e vuoi vederla subito realizzata. o che possono aiutarti a generare tutte quelle immagini che non hai o non riesci a trovare nelle tue banche dati fotografiche. Possono insomma essere integrati nei processi creativi ma sotto la supevisione di un designer, un grafico o un direttore umano.
Ciòdetto c’è molto da studiare e da imparare. Se consideriamo Midjourney che forse ad oggi è lo strumento di Ai generativa più sorprendente occorre studiare la”grammatica” del prompt. Vuole dire che le descrizioni in linguaggio naturale che vengono tradotti in immagini richiedono competenza e saperi multidisciplinari che vanno dalle tecniche di fotografia alla storia dell’arte.
Esistono in rete e nei siti di Ai delle vere e proprie guide tecniche. Per esempio su Midjourney ma anche con Dall-E2, Stable Diffusion e via dicendo puoi essere preciso (e felice) se sai quello che vuoi.
Si parte dal prompt che poi è la descrizione in linguaggio naturale di quello che vuoi che sia portato a terra. In Midjourney si parte con /imagine. Prima si descrive il soggetto, più dettagli ci sono e meglio è, poi si passa al come si vuole realizzare questa immagine (con quali strumenti, con quali stile e con quale livelli di creatività). Con alcuni software si possono fornire (caricare) fotografie come riferimento da cui partire. È bene fare attenzione che siano di nostra proprietà o con licenze libere da copyright. Si può fare ma non è consigliabile perché la descrizione testuale e comunque la più interessante. Infine ci sono anche dei parametri, non è tutto e solo qualitativo. Alla fine del prompt si devono inserire numeri (parametri) per determinare le proporzioni dell’immagine e le dimensioni. Nel caso di Midjourney i pulsanti “U” servono per ingrandire una delle immagini, mentre i pulsanti “V” permettono di generare variazioni. Qui una breve guida sui setting.
Una volta descritto il soggetto e gli elementi che cerchi devi occuparti di organizzarli. Puoi decidere il tipo di fotocamere che vuoi usare, gli obiettivi e il diaframma per gestire la luce. Puoi scegliere la posizione di scatto della foto. Puoi poi ispirarti a movimenti artistici, correnti narrative, stili fotografici come il minimalismo, il grunge o lo stile manga. Si può anche direttamente scegliere un autore come Pablo Picasso, Leonardo da Vinci o Gustav Klimpt. Puoi lavorare sulle emozioni e sulle espressioni e lasciare all’Ai la creatività di creare un contesto temporale. Se nel prompt di comando di Midjourney inseriamo il comando /settings, avremo accesso alle impostazioni dell'immagine. Esiste anche un comando chiamato “caos” dove puoi decidere su una scala da o a 100 quanta libertà di interpretazione lasciare alla macchina. E poi c’è il costo. Midjourney funziona con il sistema del GPU time, ossia dei minuti che occorrono per generare un’immagine. Basic Plan — al costo di 12,20 dollari/mese o 117,12 dollari/anno (IVA inclusa) con 200 minuti al mese di GPU time.
loading...