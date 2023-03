Ascolta la versione audio dell'articolo

La nuova versione al momento è disponibile solo nella versione a pagamento di Chatgpt (Plus). Numerosi esperti, professori, aziende specializzate clienti di OpenAi e giornalisti di stampa internazionale (come il New York Times) sono riusciti a provarlo. OpenAi oggi ha anche presentato Gpt-4 sul proprio sito, con diversi test che ne dimostrano il grosso passo in avanti rispetto alla versione precedente



Cosa cambia?

OpenAi dice che renderà Gtp-4 disponibile su ChatGpt (che oggi, a una nostra prova, è ancora su Gpt 3.5) e tramite API ad aziende selezionate (con una lista d'attesa).I progressi principali sembrano due: la versione 4 è più precisa (fa meno errori) e anche può analizzare immagini, descrivendole nei dettagli e persino poi rispondendo a domande collegate. Ad esempio, in una prova un utente gli ha dato un'immagine dell'interno del frigorifero, chiedendogli quali ricette si possono fare con quei cibi che si vedono. E il bot ha fornito alcune ricette, corrette, con quegli ingredienti. La versione 4 resta imperfetta, a quanto emerso dalle prove. Continua a confondersi e a inventare cose. Resta inoltre limitato temporalmente, perché è stato allenato con dati fermi ad agosto (rispetto al 2021 della versione precedente).

Il cambiamento con il motore di ricerca

Un limite che Microsoft ha superato abbinando ChatGpt al motore di ricerca Bing .I test di OpenAi e vari indipendenti hanno confermato l'aumento di accuratezza, nel dare risposte a 14mila domande di diverse materie e prese da esami universitari o professionali. Ha superato quello per diventare avvocati negli Usa, ad esempio. Si noti come, secondo i test OpenAi, l'accuratezza in italiano è all'84,1 per cento, il dato più alto dopo l'inglese (85,5 per cento). Anil Gehi, professore associato di medicina e cardiologo presso l’Università del North Carolina a Chapel Hill, ha descritto al chatbot la storia medica di un paziente che aveva visitato il giorno prima, comprese le complicazioni post ricovero ospedaliero.

Dove si vedono i primi progressi.

La descrizione conteneva diversi termini medici che i non addetti ai lavori non avrebbero capito. Gehi ha chiesto come avrebbe dovuto trattare il paziente e il chatbot gli ha dato la risposta giusta. Ha colpito anche la capacità di descrivere le immagini, con grande minuzia e anche con molti paragrafi descrittivi di testo. L'ha fatto per un'immagine tratta dal telescopio spaziale Hubble, ad esempio. È risultato più preciso di prima anche in altri ambiti, come la contabilità fiscale o la programmazione. È riuscito anche a fare una sintesi corretta di un lungo articolo del New York Times, una prova che spesso ChatGpt fallisce. A volte si sbaglia anche la versione 4, però, come emerso nei test e persino può ancora faro clamorosamente. Ossia continua ad avere “allucinazioni”, termine tecnico usato nel campo dell'intelligenza artificiale per definire invenzioni di sana pianta. Ad esempio, alla richiesta di indirizzi di siti web che descrivessero le ultime ricerche sul cancro, a volte ha generato indirizzi internet che non esistevano. I progressi di Gpt-4 sono dovuti all'uso di un più grande database di addestramento e a un ulteriore affinamento (fine tuning) con revisori umani. Resterà da vedere, nei prossimi mesi, l'impatto di queste migliorie sull'utilizzo pratico di Gpt-4 da parte di utenti e aziende, anche in prodotti di terze parti che ne utilizzino le API.