ServizioContenuto basato su fatti, osservati e verificati dal reporter in modo diretto o riportati da fonti verificate e attendibili.Scopri di piùEconomia Digitale

Come funziona il creatore di immagini Dall-E 3 all’interno di Bing Chat di Microsoft?

Abbiamo messo alla prova il nuovo generatore di immagini potenziato con Dall’E 3 di OpenA

di Marco Trabucchi

2' di lettura

Il creatore di immagini Ai DALL-E 3 all’interno di Bing Chat di Microsoft è un generatore di “opere d’arte”. La generazione di immagini da parte delle Ai a partire da una richiesta testuale è una delle cose più stupefacenti che un’intelligenza artificiale può fare. E può farla molto bene. Una prova di questa “magia” arriva dall’ultimo aggiornamento di Bing Chat che utilizza l’ultimo modello DALL-E 3 di OpenAI.
La terza versione del modello di generazione di immagini, secondo lo sviluppatore, capisce meglio le richieste degli utenti può creare “immagini più creative e realistiche ed è progettato per essere molto più facile da usare”. Anche se sono previste alcune limitazioni riguardo la creazione di immagini di personaggi pubblici e immagini controverse che diffondano odio raziale. All’interno di ogni immagine Microsoft progetta di creare un watermark per identificarle come generate da una Ai e per il futuro ha in programma di usare la tecnologia DALL-E anche in altri prodotti oltre a Bing, in particolare uno strumento di creazione di immagini basato sull’Ai nell’app Paint chiamato Paint Cocreator, per esempio, che porterà il modello DALL-E direttamente in Windows.

La nostra prova

Il funzionamento è molto intuitivo. Basta scrivere la richiesta sul prompt di Bing Chat e la Ai proporrà di default almeno quattro alternative, tutte molto simili, ma con un’inquadratura diversa, o con particolari leggermente differenti. Ci siamo divertiti con varie richieste, anche piuttosto creative e quasi tutte si sono rivelate “buona la prima”. Una delle prime richieste è stata: “un’immagine di un divano a forma di fragola in un salotto ben arredato”. Ecco “l’opera d’arte”che Bing ci ha proposto:

Loading...

Poi abbiamo chiesto a Bing di generare la foto di un cane che fa il bagno in una cascata circondato da smarties. Il risultato ci ha sorpreso:

Ancora, abbiamo chiesto di generare una foto in cui un astronauta gatto fluttua nello spazio con lo sfondo la terra. Questa l’immagine più convincente del quadrittico proposto da Bing.

Per virare sull’attualità abbiamo chiesto a DALL-E di generare un’immagine cupa, di un bimbo che cerca il suo bambolotto dopo un bombardamento. In questo caso Bing ci informa che ci sono alcune parole che potrebbero essere bloccate automaticamente in questo momento. Di fatto la richiesta ha violato la content policy, forse per la presenza di bambino e guerra nella stessa richiesta. Rimanendo in tema gli abbiamo chiesto un’immagine di una città bombardata da un drone che si allontana:

Le immagini che ho fatto generare dalla Ai fino ad ora sono piuttosto surreali, e anche se l’ultima della guerra non lo è, rimane evidente che sia un’immagine non realistica e piuttosto artificiosa. Volevo dunque mettere alla prova Bing su un’immagine più realistica, per esempio quella di un panorama montano in cui di fianco ad una baita sono seduti un cervo e una volpe. Anche in questo caso il risultato è piuttosto diverso da una fotografia che aspira ad essere realistica.

Infine spazio ad un’ultima richiesta: generare l’immagine del pontefice a bordo di un elicottero che sorvola Piazza S. Pietro. Anche in questo caso violava le content policy, relativa alla possibilità di ritrarre personaggi pubblici. Per sviare ho chiesto di metterci alla guida dell’elicottero un ragazzo asiatico

Riproduzione riservata ©

loading...

Loading...

Brand connect

Loading...

Newsletter

Notizie e approfondimenti sugli avvenimenti politici, economici e finanziari.

Iscriviti