DeepMind presenta una serie di novità per la realizzazione di robot che possano integrarsi nella vita quotidiana ispirandosi anche alle tre leggi della robotica. I precetti della robotica di Isaac Asimov rispettavano la necessità di sicurezza (prima Legge), servizio (seconda Legge) e autoconservazione (terza Legge) di macchine dotate di intelligenza artificiale. “Tre leggi” che, nell’universo fantascientifico creato da Asimov, rappresentano le fondamenta del loro comportamento e delle loro interazioni con l’uomo.

È proprio ispirandosi (anche) a queste tre leggi che il team di robotica di Google Deep Mind ha pensato di creare una sorta di “Costituzione del robot”, descritta come una serie di suggerimenti incentrati sulla sicurezza che istruiscono il modello di linguaggio per evitare di svolgere compiti che potrebbero compromettere la sicurezza di esseri umani e animali.La “Costituzione del robot” è solo una parte – forse la più suggestiva – di importanti aggiornamenti tecnologici presentati da DeepMind sul blog ufficiale. Questi rappresentano un tassello fondamentale per la creazione di robot capaci di codificare obiettivi pratici tipicamente “umani,” al fine di prendere decisioni rapide, migliori e più sicure in tutte le attività affidate loro.DeepMind sta percorrendo questa strada grazie alla sperimentazione del sistema AutoRT, capace di sfruttare i modelli di intelligenza artificiale di grandi dimensioni, integrando Large Language Models (LLM) e Visual Language Models (VLM).

Questo sistema realizza un sistema capace di schierare e dirigere simultaneamente una serie di robot, dotati anche di videocamere e attuatori, per raccogliere dati di addestramento in nuovi ambienti. Ogni robot sfrutta un VLM per comprendere l’ambiente circostante e un LLM per affrontare eventuali compiti complessi, come ad esempio “appoggiare il caffè sulla scrivania.”



La sperimentazione

“Prima che i robot possano essere integrati nella nostra vita quotidiana, devono essere sviluppati in modo responsabile con una solida ricerca che ne dimostri la sicurezza nel mondo reale”, scrive nella comunicazione ufficiale DeepMind che ha programmato i robot in modo da garantire solide misure di sicurezza già ampiamente diffuse e utilizzate nelle grandi aziende produttive, come ad esempio il blocco automatico dei robot qualora la forza sulle loro articolazioni superi un determinato valore. Inoltre, nella sperimentazione condotta dal team di Google, tutti i robot sono stati mantenuti in contatto visivo con un supervisore umano dotato di un interruttore di spegnimento.Un’ampia sperimentazione che ha coinvolto i ricercatori per un periodo di sette mesi, in cui il sistema si è mostrato capace di coordinare in maniera sicura fino a 20 robot contemporaneamente e fino a 52 robot unici in totale, in una varietà di scenari negli uffici della società, raccogliendo un set di dati diversificato composto da 77 mila prove robotiche in oltre 6600 attività uniche.I robot utilizzati nella sperimentazione non sono umanoidi, ma dei bracci robotici posizionati su base mobile. Per ciascun robot, il sistema utilizza la telecamera per comprendere l’ambiente circostante (VLM) e successivamente, grazie ai LLM, suggerisce un elenco di compiti appropriato che il robot può svolgere.

Le altre tecnologie sperimentate da Google

La seconda novità presentata dal team DeepMind è chiamata Self-Adaptive Robust Attention for Robotics Transformers, o SARA-RT, che rende più efficienti gli attuali modelli Robotics Transformer che Google utilizza nei più recenti sistemi di controllo robotico (un incremento della precisione del 10,6% e una maggior velocità del 14%). Con SARA-RT i ricercatori DeepMind sono stati in grado di usare un nuovo metodo di messa a punto, battezzato “up-training”, che riesce a convertire la complessità quadratica in complessità lineare, andando ad aumentare la velocità del modello originale preservando, al contempo, la qualità. Infine i ricercatori DeepMind hanno presentato RT-Trajectory, un modello che aggiunge contorni visivi bidimensionali che descrivono i movimenti e le appendici del robot nei video di formazione. Il modello acquisisce ogni video in un set di dati di addestramento e vi sovrappone, ad esempio, la traiettoria del braccio robotico mentre esegue la pulizia di un piano di lavoro. Un’attività intuitiva per un essere umano ma che un robot potrebbe tradurre in molti modi diversi.