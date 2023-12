Ascolta la versione audio dell'articolo

3' di lettura

Settima scorsa, Google ha ufficialmente annunciato Gemini, il suo modello AI più avanzato. Disponibile in tre varianti - Ultra, Pro e Nano - Gemini si adatta a diverse esigenze. La differenza principale tra le tre versioni sta nella dimensione del modello di apprendimento automatico. Gemini Ultra è il più grande, con 1,6 trilioni di parametri, seguito da Gemini Pro con 100 miliardi di parametri e Gemini Nano con 10 miliardi di parametri. Una dimensione maggiore del modello significa che Gemini Ultra è in grado di apprendere più informazioni e generare risultati più accurati e creativi, ma anche che è più costoso e richiede più risorse per l’esecuzione. Gemini Pro è una buona scelta per la maggior parte delle applicazioni dal momento che è ancora abbastanza grande da generare risultati di alta qualità, ma richiede una potenza molto inferiore rispetto a Gemini Ultra. Gemini Nano, invece, è la scelta migliore per le applicazioni che richiedono un modello più piccolo e meno costoso. È ancora in grado di generare risultati di buona qualità, ma potrebbe non essere adatto per applicazioni che richiedono la massima accuratezza. Mentre la versione Nano è già in uso nel Pixel 8 Pro di Android, una versione speciale di Gemini Pro alimenta Bard e la versione ultra arriverà prossimamente. La novità di questa settimana è che Gemini Pro è ora accessibile agli sviluppatori e alle imprese.



Caratteristiche Principali di Gemini Pro

Gemini Pro offre una finestra da 32K per il testo e le versioni future prevedono una finestra ancora più ampia. Dal momento che è appena stato presentato, Google ha ben pensato di renderlo molto interessante proponendo un utilizzo gratuito entro certi limiti e prezzi molto competitivi per chi ha bisogno di un utilizzo intendo. Inoltre, ci sono molte caratteristiche che lo rendono potenzialmente più semplice da usare di altre soluzioni come la chiamata a funzioni esterne, il supporto a 38 lingue e un ambiente di sviluppo completo e pienamente interfacciabile con gli IDE più usati.

Loading...

Gemini Pro Vision e SDK

Un aspetto tecnicamente tutto da esplorare di Gemini Pro è il suo endpoint multimodale, Gemini Pro Vision, che elabora sia testo che immagini, fornendo output in testo. Per facilitare lo sviluppo di applicazioni, sono disponibili SDK per vari linguaggi di programmazione, tra cui Python, Android (Kotlin), Node.js, Swift e JavaScript, permettendo la creazione di applicazioni versatili e adattabili.

Google AI Studio e Vertex AI

Google AI Studio, uno strumento di sviluppo interamente sul Web, permette agli sviluppatori di creare rapidamente prompt e ottenere una chiave API per lo sviluppo di app. Il fatto che offra una quota gratuita di 60 richieste al minuto lo rende ideale per sperimentare e creare applicazioni basate su IA che non prevede usi troppo intensi. Per progetti più avanzati, gli sviluppatori possono passare a Vertex AI su Google Cloud, che offre ulteriori funzionalità per la personalizzazione di Gemini, con pieno controllo dei dati e vantaggi aggiuntivi in termini di sicurezza, privacy e conformità. L’ambiente di sviluppo è concentrato nell’ottenere app basate sull’IA con il minimo sforzo, uno scopo che è comune tra le aziende che propongono i propri modelli, e il fatto che si possano integrare gli strumenti di sviluppo con quelli più diffusi nel mercato è sicuramente un punto a favore della soluzione di Google.

Imagen2 – nuove funzioni che fanno la differenza

Integrato in Vertex c’è anche la nuova versione di Imagen che produce immagini di alta qualità partendo da prompt testuali. Oltre a questa funzione ormai ben diffusa in molti dei prodotti di IA, Imagen 2 ha il vantaggio di poter creare delle immagini con del testo specificato nel prompt. Possiamo per esempio decidere la scritta su di una tazza o, come si vede nell’esempio di Google, la marca del dentifricio sul tubetto. Addirittura, adesso è possibile chiedergli di generare un logo aziendale completo e poi sovrapporlo a delle immagini generate. Un ambiente di sviluppo AI interessante e a buon mercatoI modelli AI con i quali sperimentare non mancano in questo periodo, ma quello di Google propone alcune semplificazioni nella fase di sviluppo che potrebbero far comodo. Inoltre, la presenza di un piano gratuito piuttosto generoso e di costi contenuti nell’utilizzo più spinto lo rendono molto appetibile in un momento in cui non è semplice scegliere quale tecnologia sposare.