L’intelligenza artificiale generativa è multimediale e specializzata
Dai brani musicali alle presentazioni in Power Point con grafici e immagini. L’intelligenza artificiale esce dai confini della scrittura ma fa una cosa alla volta. Non è multitasking come gli umani
di Luca Tremolada
3' di lettura
Non più solo testo, domande o risposte. Ed è stato un attimo. Ricercatori di Google hanno creato un’intelligenza artificiale in grado di generare brani musicali della durata di minuti da prompt di testo. Pare che possa persino trasformare una melodia fischiata o canticchiata in altri strumenti, come fa DALL-E con le immagini. Il modello si chiama MusicLM e, chi l'ha provato, come i giornalisti di Techcrunch, dicono che sia impressionante.
Non fatichiamo a credergli. Se volessimo raccontarla come se fosse un romanzo, potremmo dire che ChatGpt è mutata, si è evoluta, si è spinta oltre il testo ed è ora pronta a diventare omniscente. In realtà l’AI generativa è nata e vivrà agnostica. Anzi, è multimediale dentro ma non è multitasking come gli esseri umani. Nel senso che per ora sa fare bene una cosa alla volta. Ecco perché già prima che ChatGpt diventasse il fenomeno che noi conosciamo erano già comparse nuove forme di AI che si sono specializzate nel diventare le migliori nel loro campo. Ecco alcuni esempi.
Ripartiamo dai testi, dalle parole per essere ancora più espliciti. Writesonic o Copy.ai sono due soluzioni online che usano l’AI per creare testi. Abbiamo provato Copy.ai che si appoggia a GPT-3 la versione precedente di ChaGpt ed è sia online che a pagamento. Come funziona? Scegli prima il social o la piattaforma per cui vuoi produrre testo (ci sono tutti), poi il tono (amichevole, spiritoso ecc.) e l’argomento. Chiaramente dovete dirgli qualcosa dell’argomento che poi volete declinare. Devi, cioè, descrivere il tuo prodotto o sito o progetto. In poche parole senza dilungarti troppo. Se è già fatto puoi semplicemente mettere quello che già avete scritto e lui penserà a trasformarlo anche in ebook, comunicato stampa, newsletter ecc. Il risultato è sorprendente ma inventa alla grandissima. Per fortuna viene fornito un editor per correggere. Per risparmiare tempo e fatica con Power Point ci siamo affidati a Chatbgc (www.chatba.com/) che è il tool per presentazioni più chiacchierato del momento. Sviluppato dagli studenti di Stanford AI PhD Silas Alberti e Joseph Semrai, ChatBCG implementa il modello BCG-3 (Bi-modal Conditional Generation). Come funziona? Puoi aggiungere un argomento o un prompt e lasciare che il chatbot faccia la sua “ magia”. In meno di un minuto ottieni la tua presentazione. Il software pesca dal web temi, layout, immagini, infografiche, contorni, intestazioni e punti elenco. Inoltre crea parole chiave in grassetto. Puoi anche esportare le diapositive nei formati Pptx e Ptf. Nel sito si legge che presto verranno aggiunte altre funzionalità come l’editing conversazionale, i grafici basati sui dati e l’utilizzo dei contenuti del tuo blog. Come è venuta la presentazione? Generica. Hai la sensazione di frasi scopiazzate a destra e a manca. Ma più specifico è il prompt e più preciso è il risultato. Peraltro va ammesso che non è solo l’AI a “prendere” spunto dal web.
Passando ai video forse i più immaginifici sono Reals e Synthesia che permettono di realizzare una presentazione video con uno speaker, partendo semplicemente da un testo. L’AI anima il personaggio scelto in sincrono con il labiale. Più interessante è invece Lumen5: non capisce l’italiano ma è utile per creare shorts su Youtube. Lo puoi fare direttamente da blog, articoli o testi. Lui li legge e li trasforma direttamente in video. Di buono ha che è veloce. E non devi pensare a niente. E Magisto è uno strumento adatto a chi non vuol perdere tempo con i montaggi. Basta caricare un video, scegliere uno stile di montaggio e una colonna sonora e l’algoritmo farà il resto.
Lato audio se volete generare una voce c’è Play.ht: è in inglese, ci trovi il clone delle voci di Jfk ed Elon Musk. Come funziona? Prima decidi se è per un podcast o per un audiolibro o per il tuo sito. Hai sette giorni di prova gratis e poi sono 200 dollari al mese. Converte il testo in formato audio (wave e mp3). Com’è? Negli Stati Uniti un podcaster ha realizzato una intervista riportando in vita Steve Jobs. Sembrava tutto vero.
Per la musica poi, accanto ai tools per professionisti come Amper Music, ce ne sono moltissimi come AIVA.Ai e Beathoven.ai che promettono di comporre musica Royalty Free (ossia utilizzabile anche per progetti commerciali) utilizzando tecniche di generazione AI avanzate.
Arrivando, infine, alla programmazione il tool da tenere d’occhio è GitHub Copilot: è uno strumento di intelligenza artificiale basato su cloud sviluppato da GitHub e OpenAI che ha lo scopo di tradurre il linguaggio naturale, costituito da semplici istruzioni in lingua inglese, nei più popolari e utilizzati linguaggi di programmazione.
Mentre scriviamo ne stanno sicuramente nascendo altri. Il consiglio per tutti è controllare quello che ci propongono. Soprattutto se vogliamo usare questi tool per scopi professionali.
loading...