Tecnologia

Università, ecco come i data scientist incontrano le aziende

  • Abbonati
  • Accedi
Economia Digitale

Università, ecco come i data scientist incontrano le aziende

Provate a entrare in una qualsiasi università, chiedete dei corsi di informatica e delle aule dove si studia per diventare data scientist. A questo punto mettetevi davanti a una macchinetta del caffè e provate a intercettare le chiacchiere degli scienziati dei dati del futuro. Uno su due - la statistica prendiamola con il beneficio del dubbio - vi dirà che il problema non è mai o quasi l’algoritmo o la matematica ma i dati. Dove trovarli, come accedere ai database, dove affinare le ricerche e addestrare i programmi di machine learning. «Si parte sempre dai dati. Ma la data science non mi stancherò mai di ripeterlo non è informatica. È una disciplina nuova». Carlo Batini è coordinatore del gruppo di lavoro sul corso di Laurea Magistrale in Data Science all’Università Bicocca di Milano. Il corso è iniziato due anni fa ed è un laboratorio a cielo aperto per provare a capire come si sta evolvendo questa che è probabilmente la professione più ricercata nell’ambito dell’Ict (Information and Comunication Technology).

Un report della società di consulenza Deloitte pronostica una “carenza” di un milione di analisti di dati a livello globale entro il 2018. L’equivalente di due volte i professionisti Ict che saranno richiesti dall’intera Europa entro il 2020. «Tutti li vogliono anche se non esiste una ricetta valida per tutti - commenta Batini -. È infatti interessante osservare come gli iscritti provengano da un vasto insieme di competenze: da noi oltre 40% ha una formazione da economista, il 20% sono statistici e il 15% informatici». Il valore di quello che torna a essere un sapere rinascimentale, multidisciplinare, aperto è compreso bene dalle grandi aziende. «Meno dalle piccole e medie - sottolinea Batini - che non hanno risorse sufficienti per gestire la complessità della governance. Con Assolombarda stiamo lavorando in questa direzione ma quello che manca è anche la consapevolezza sulle potenzialità dell’uso dei dati».

I progetti a cui lavorano i data scientist milanesi descrivono un approccio al marketing e al business che non ha precedenti nello studio dell’economia aziendale. L’apprendimento automatizzato può aiutare un operatore telefonico a individuare se ci sono comportamenti che si ripetono nei tassi di abbandono. Con il machine learning le utilities energetiche possono sperimentare la manutenzione predittiva, ossia capire in anticipo la probabilità che una centralina si guasti o abbia bisogno di un intervento tecnico. Correlando i dati meteorologici con quelli di business si può studiare se esistano fattori stagionali in ambito commerciale. «Il discrimine sono sempre e solo i dati, la scelte delle fonti, l’accesso a database pubbici e privati. Una delle killer application per i nostri studenti è rappresentata da strumenti come Kaggle che usiamo all’università per far incontrare la domanda di data scientist e l’offerta di database da parte della aziende».

Acquisito l’anno scorso da Google, Kaggle è un marketplace dove si incontrano offerta di dataset e data scientist. L’università Bicocca ha partecipato ad alcune challenge che per le aziende sono una manna dal cielo. Il sistema si limita a mettere in contatto studenti e aziende disintermediando i docenti. Su questa falsariga ci sono anche altre piattaforme online come DrivenData o Data.World che è una sorta di Facebook per data-journalist. Esistono tool a disposizione di tutti per trattare grandi moli di dati. Come ad esempio MongoDb, Neo4j , Apache Kafka. Tutti hanno le potenzialità di offrire la possibilità di analizzare ed estrarre significato dai dati. Ed è questo forse il punto di contatto tra i data scientist e chi si occupa di giornalismo di dati. La pancia del reporter da una parte e il rigore dello scienziato dei dati dall’altro. «Giornalismo e dati sono mondi che si parlano - commenta Battini -. Il punto di contatto è proprio l’individuazione delle fonti autorevoli, le domande che vogliamo rivolgere ai database e la tecnologia». Il primo terreno di prova sarà proprio Info Data, il blog di data journalism del Sole 24 Ore che, in collaborazione con gli studenti in Data Science dell’ateneo milanese, ha iniziato una collaborazione per raccontare quello che i dati ancora non dicono.

© Riproduzione riservata