Big data e innovazione, l’intervista a Alessandro Chessa

Alessandro Chessa è un fisico teorico con dottorato all’Università di Cagliari. Presso la Boston University ha lavorato come postdoc in Fisica Teorica per poi diventare Research Associates occupandosi di Econofisica. Ha lavorato presso l’ICTP di Trieste e l’Istituto per i Sistemi Complessi alla “La Sapienza” di Roma. Attualmente insegna alla Luiss “Tecniche di Analisi dei Big Data”. È Ceo di Linkalab, laboratorio computazionale per le applicazioni dei Sistemi e delle Reti Complesse. Esperto di Social Network Analysis, si è occupato in più di un’occasione, di analisi del sistema politico. Ha pubblicato un articolo, “Voting Behavior, Coalitions and Government Strength through a Complex Network Analysis” nel dicembre 2014, in cui esamina il comportamento di voto in Parlamento tramite la teoria dei grafi.

Con la mole di dati che internet sta permettendo di accumulare si sta creando una tensione fra l’anelito alla conoscenza e la sicurezza, intesa come sicurezza nazionale, aziendale e privata. Ovvero da una parte si vogliono ottenere dati che permettono di avere una maggiore conoscenza ma dall’altra, questa stessa conoscenza espone gli Stati, le aziende e i privati cittadini a minacce legate alla cybersecurity e alla privacy. Come, secondo lei, questa tensione può essere risolta? Soprattutto, nell’ottica del decisore pubblico, quali interventi di policy potrebbero essere portati avanti?

C’è un evidente paradosso tra l’anelito dell’uomo alla conoscenza, alla scoperta dei meccanismi segreti della propria esistenza, al capire profondamente chi siamo, che presuppone un alto livello informativo, una puntuale e possibilmente massiva raccolta di dati, e il voler porre un argine al disvelamento delle dinamiche intime della nostra vita di relazione, oggi minacciata dai vari social network online (Facebook, Instagram, Twitter per citare i più noti), sui quali abbondantemente riversiamo le nostre più private confessioni. Non mi pare un tema nuovo. Abbiamo in mente Jorge, il bibliotecario dell’abbazia de “Il Nome della Rosa” di Eco. La conoscenza, i libri, erano custoditi da qualcuno che decideva chi potesse beneficiarne. Quindi vogliamo bruciare i libri (distruggere tutti i dati), come accade nel romanzo, per renderli inaccessibili, o vogliamo provare a regolare l’accesso alle informazioni, a renderlo più ampio? Di sicuro, allo stato attuale nel quale i dati sono appannaggio dei grandi social, il pericolo d’inaccessibilità, oscuramento e manipolazione è enorme.

I dati dovrebbero essere un bene collettivo, come le risorse primarie di sostentamento del pianeta, ma non per questo gli stati potrebbero fare meglio.

Il caso cinese ci dovrebbe far riflettere. Forse la soluzione è determinare un organismo regolatorio ultra-nazionale, come ne esistono per salvaguardare i diritti universali dell’uomo, la protezione dei bambini e per combattere la fame del mondo. In Europa si sono fatti dei passi in avanti con la regolamentazione GDPR, che però è più rivolta a determinare un perimetro per l’utilizzo dei dati personali, piuttosto che all’attivazione di meccanismi che ne allarghino il possibile impiego e ne valorizzino le potenzialità. Inoltre, il problema non si risolve imponendo regole in un solo continente, creando anche un possibile svantaggio competitivo per le aziende europee nei confronti di mercati quasi totalmente liberalizzati su questo fronte. Il problema è mondiale a occorre risolverlo a quel livello, con accordi internazionali, esattamente come si fa con gli armamenti nucleari, e c’è da dire che il potenziale pericolo per il futuro dell’umanità sul tema dei dati potrebbe non essere così inferiore all’indiscriminato utilizzo di una bomba atomica.

Quando si parla di dati in qualche modo di sta anche parlando di Intelligenza Artificiale e di Machine Learning. Alcune applicazioni riguardano le Marketing Technologies (Mar-tech), ossia la compenetrazione fra Intelligenza Artificiale e Marketing. Qual è l’obbiettivo del Mar-tech e potrebbe essere associato anche a tecniche di Social Network Analysis anche per la profilazione del decisore?

La connessione tra dati e il machine learning non è così evidente anche se in realtà la relazione è profonda. I nuovi sistemi d’intelligenza artificiale non sarebbero stati oggi possibili senza i big data, l’enorme massa di dati che con il tracciamento di tutte le nostre attività sociali e i flussi dei dati aziendali vengono conservati nelle piattaforme cloud. Le macchine apprendono dai nostri esempi. La conoscenza che abbiamo prodotto nei secoli è implicitamente accumulata nei dati che sono il risultato delle nostre azioni e dei nostri pensieri. Questi nuovi sistemi di apprendimento automatizzato hanno bisogno di assimilare nuova conoscenza attraverso lo scrutinio di milioni di immagini e testi nei quali noi umani possiamo indicare contenuti e significati (supervised learning). Ci sono dei casi in cui la macchina trova da sola i pattern significativi, una volta che abbiamo trovato in qualche modo le relazioni che legano gli elementi di questi sistemi complessi (unsupervised learning). Ed è proprio qui che entra il gioco la Social Network Analysis (SNA).

I sistemi di classificazione di machine learning più avanzati si basano sulle Reti Neurali Artificiali, layer di reti connesse al loro interno e tra di loro da legami i cui pesi contengono implicitamente la conoscenza relativa al problema di classificazione. Queste speciali reti distinguono con grande efficacia cani e gatti nelle immagini, una volta che sono state addestrate su milioni di immagini annotate, dove l’uomo ha indicato esplicitamente i due tipi di animali, ma come questa conoscenza sia rappresentata nei pesi di questi legami, sorta di sinapsi artificiali, non è dato sapere. Si parla oggi di XAI (per Explainable AI) come la nuova frontiera della ricerca che mira a fare un ‘reverse engineering’ di queste misteriose reti di conoscenza. Nelle Complex Networks e in particolare nella Social Network Analysis invece le reti sono intelligibili sia all’uomo che alla macchina.

Una volta che vengono espressamente decise le relazioni tra le entità/nodo della rete, nel caso dei social persone e relazioni di amicizia/condivisione di contenuti, è immediato capire le dinamiche sistemiche sottostanti. La ‘Rete Complessa’ è di fatto una mappa esplorabile del mondo sociale che ci rivela la posizione e l’importanza dei nodi/persona, il loro ruolo, la capacità di diffondere le informazioni e la propensione a formare dei cluster/comunità di pratica. Facendo per esempio riferimento a una problematica Mar-tech, come l’individuazione degli influencer in una rete sociale come Instagram, quello che potremmo ricavare con una SNA è una misura di centralità sul grafo associato alla rete, cioè un algoritmo che esplorando tutti i cammini possibili ci possa rivelare chi tra tutti i nodi siano quelli più centrali e quindi capaci nell’influenzare i comportamenti d’acquisto di un certo prodotto.

La Scienza delle Reti (Network Science) solo di recente si sta affermando come nuovo e competitivo strumento per lindagine dei sistemi sociali e per lestrazione dei contenuti rilevanti.

La Social Network Analysis, a cui il nostro Centro Studi, FBLab, ricorre già da qualche anno per le analisi più complesse, se applicata ad un sistema politico dà risultati eccezionali e più in generale, sembra che le analisi politiche vengano sempre più portate avanti da sofisticate tecniche matematiche e fisiche. Lei stesso ha pubblicato un articolo, “Voting Behavior, Coalitions and Government Strength through a Complex Network Analysis” nel dicembre 2014, in cui esamina il comportamento di voto in Parlamento tramite la teoria dei grafi. Al netto di quanto avete scoperto, quando si studia un sistema politico o decisionale attraverso la matematica, quali sono le maggiori difficoltà che si incontrano? Quali invece, i punti di forza?

Se mi è concessa una battuta per cominciare, la maggiore difficoltà che si incontra è convincere chi ha la competenza di dominio, i politologi nella fattispecie, quanto siano potenti e anche rigorose queste tecniche. Questo settore disciplinare è ancora spesso dominato da teorie qualitative e quando entrano in campo metodologie da altri settori, più legati alle scienze dure, lo scetticismo prevale.

‘Come possiamo dominare fenomeni sociali con la matematica?’ Potrebbe essere il retropensiero. Infatti il punto non è capire le persone con la sola matematica, ma piuttosto avere uno strumento più potente di analisi che poi messo in mano a chi ha la competenza di dominio, la capacità di dare significato alle misure e di saper interpretare i risultati per dare risposte comprensibili (quindi infine umani che parlano ad altri umani), ci faccia accedere a una conoscenza più profonda e meno arbitraria, almeno secondo i limiti di comprensione raggiunti al presente livello d’indagine. Ci sono come sempre delle eccezioni e di recente ho trovato un’interessante sponda di ricerca nel gruppo del prof. Lorenzo De Sio alla Luiss, una notevole eccellenza nei settori più avanzati della politologia in Italia.

Nello studio che lei cita, per esempio, siamo riusciti a ricostruire la rete di relazioni tra i deputati della Camera, utilizzando le votazioni in circa un anno di lavori parlamentari. I deputati sono messi in relazione in base al fatto che possano votare concordemente rispetto a una certa proposta legislativa, cosa che capita molto spesso se si appartiene allo stesso partito o alla stessa colazione (legame forte), ma che non è comunque del tutto improbabile anche tra due deputati di fazioni opposte (legame debole).

La rete nel suo complesso sistemico coglie la grana fine di queste dinamiche di relazione, potendo distinguere parlamentari fedeli alle consegne di partito, da politici che tendono invece a flirtarecon chi sulla carta la pensa diversamente, magari per una pura convenienza personale.

Abbiamo messo a disposizione questo studio di alcuni quotidiani nazionali e per tornare al discorso iniziale, con nostra grande sorpresa, abbiamo trovato non poche resistenze nei notisti politici a confrontarsi con questi risultati. Purtroppo, anche in campo giornalistico persiste una spinta autoreferenziale secondo la quale l’immagine che ci siamo fatti negli anni, magari frequentando assiduamente il transatlantico e facendo comunella con i parlamentari, sia superiore alle ‘verità’ che possono rivelarci i dati.

La mia proposta non è certo di sostituire la competenza di un giornalista esperto di dinamiche parlamentari con un algoritmo, ma per lo meno di partire dal presupposto giusto, dal dato di fatto, dai dati appunto, per poi andare oltre con la nostra esperienza. Se attecchiranno questo tipo di studi, come in Luiss, intravedo un interessante futuro per la Scienza delle Reti applicata alla politica e allo studio dei sistemi sociali in generale.