AI e supercalcolo per proteggere il territorio
| Carlo Volpe | Caffè scientifico
Frane, alluvioni, incendi e terremoti: lo Spoke 5 del Centro Nazionale HPC e Big Data sviluppa gemelli digitali e AI per prevenire e mitigare i disastri naturali in Italia
Enormi dataset, modelli AI e calcolo ad alte prestazioni: così nasce il gemello digitale tridimensionale del territorio nazionale, una piattaforma unica che può dare concretamente una mano a prevenire e mitigare i fenomeni naturali estremi. È l’obiettivo dello Spoke 5 “Ambiente e disastri naturali” del Centro Nazionale di Ricerca in HPC, Big Data e Quantum Computing.
L’Italia è uno dei paesi europei più esposti a fenomeni naturali estremi come frane, alluvioni, terremoti, incendi e attività vulcaniche. Finora, la gestione del rischio è stata frammentata e spesso basata su interventi d’emergenza piuttosto che su una reale prevenzione. Per invertire la rotta, il Centro Nazionale di Ricerca in HPC, Big Data e Quantum Computing ha avviato, con lo Spoke 5 dedicato all’ambiente e ai disastri naturali, una serie di attività di ricerca che adottano un approccio fondato sull’integrazione tra la scienza dei dati, la modellazione fisica e le tecnologie computazionali di frontiera.
Per saperne di più abbiamo intervistato Ester Pantaleo, docente e ricercatrice all’Università di Bari.
L’obiettivo del progetto è creare una piattaforma unica nazionale per mitigare i disastri naturali.
Come si realizza un’impresa del genere?
Al centro del progetto vi è lo sviluppo di un’infrastruttura scientifico-tecnologica senza precedenti in Italia che permetterà di digitalizzare, archiviare, analizzare e modellare in modo coerente un’enorme quantità di dati ambientali, provenienti da fonti diverse: archivi storici, sensori sul territorio, satelliti, rilievi geologici, monitoraggi in tempo reale. L’obiettivo è trasformare questa mole di informazioni in un gemello digitale dell’Italia: un modello tridimensionale, dinamico e in continuo aggiornamento, capace di rappresentare in dettaglio l’atmosfera, il suolo e il sottosuolo dell’intero territorio nazionale.
Dal punto di vista tecnico, questo gemello digitale sarà alimentato da modelli numerici fisico-matematici ad alta risoluzione, in grado di simulare i processi naturali che generano rischio e di fornire previsioni affidabili per supportare decisioni rapide ed efficaci. Per farlo, è necessario utilizzare le risorse offerte dal calcolo ad alte prestazioni. Infatti, solo attraverso infrastrutture computazionali parallele e distribuite, dotate di cluster GPU e CPU ad alta capacità, è possibile processare i dati e addestrare i modelli di intelligenza artificiale in tempi compatibili con l’operatività reale, ovvero nell’ordine di minuti o poche ore.
L’obiettivo è realizzare un ecosistema aperto, orientato alla massima accessibilità e trasparenza. Accanto alla componente tecnologica, si sviluppa una suite software di strumenti dedicati: wiki per la documentazione tecnica, portali di open data (come GeoNode e CKAN) per consultare e visualizzare dataset geospaziali e ambientali, interfacce grafiche intuitive per guidare gli utenti meno esperti a caricare dati ed eseguire analisi.
Tutti i modelli di intelligenza artificiale utilizzati saranno sviluppati secondo i principi della cosiddetta AI spiegabile (XAI), in modo che le decisioni algoritmiche siano trasparenti, interpretabili e verificate da esperti e decisori pubblici.
Quali sono i primi risultati già raggiunti?
Diversi progetti pilota sono già attivi e mettono in pratica le metodologie e le tecnologie sviluppate. Un esempio di grande rilievo che l’Università di Bari porta avanti, in collaborazione con il Politecnico di Bari e il CNR, riguarda la gestione del rischio frane. Abbiamo creato dei gemelli digitali di pendii instabili che integrano dati di superficie e subsuperficie, provenienti da fonti diverse come sensori, telerilevamento e rilievi geotecnici, per simulare i meccanismi che innescano le frane.
Il modello è stato testato in diverse aree con caratteristiche geologiche e climatiche differenti, tra cui Bovino in provincia di Foggia che rappresenta il sito con il maggior numero di dati. I risultati mostrano miglioramenti significativi nei tempi di intervento e nella riduzione dei costi grazie a una diagnosi più tempestiva. I dati e i modelli sviluppati, inoltre, sono accessibili anche ai tecnici di enti locali, aziende o associazioni di cittadini per usi operativi, come il monitoraggio, l’allerta precoce o la pianificazione urbana. In parallelo, stiamo avviando altri casi d’uso su incendi boschivi, sversamenti di inquinanti e rischio sismico, integrati nella stessa infrastruttura tecnologica.
Un altro esempio concreto è il progetto RETE promosso da TERNA ed ENEA, con il coinvolgimento di CMCC, CNR, FBK, Università del Salento e Università di Trento al quale lo Spoke 5 contribuisce tramite i partner Università di Bari e Politecnico di Bari. L’obiettivo è migliorare la resilienza ai cambiamenti climatici delle infrastrutture critiche, con focus sulla rete di trasmissione energetica nazionale. Utilizzando modelli avanzati di deep learning per il downscaling climatico e un approccio di modellazione di reti complesse, vengono analizzati i rischi geotecnici legati a frane rapide e cedimenti volumetrici causati da eventi meteo-climatici estremi. Il progetto si avvale di elevate risorse di calcolo HPC per simulare scenari di cambiamento climatico e supportare strategie di mitigazione e pianificazione preventiva delle infrastrutture.
In che modo sono sfruttate le potenzialità dei supercomputer?
I supercomputer sono fondamentali soprattutto quando si tratta di modellare fenomeni complessi. I gemelli digitali sono modelli altamente dettagliati e dinamici che integrano enormi quantità di dati provenienti da diverse fonti.
Grazie alle risorse HPC è possibile eseguire simulazioni numeriche avanzate che risolvono equazioni differenziali complesse su modelli tridimensionali ad alta risoluzione, tenendo conto di variabili come la composizione del suolo, la pressione idraulica, le condizioni meteorologiche e molto altro.
Inoltre, i supercomputer permettono di addestrare modelli di intelligenza artificiale e machine learning su grandi dataset storici e in tempo reale, migliorando la capacità predittiva dei gemelli digitali. L’uso di cluster distribuiti di GPU e CPU riduce drasticamente i tempi di elaborazione, consentendo di aggiornare i modelli in tempi rapidi e di rispondere tempestivamente agli eventi emergenti.
Per un efficace e tempestivo monitoraggio è imprescindibile l’accesso ad una rete che consenta il trasporto di grandi moli di dati nel minor tempo possibile
Quanto è importante disporre di reti ad alta capacità?
Per avere un efficace e tempestivo monitoraggio dei fenomeni di rischio è imprescindibile l’accesso ad una rete che consenta il trasporto di grandi moli di dati nel minor tempo possibile. Anche se è possibile immaginare, in ottica “edge”, di alleggerire il carico cui saranno sottoposte le reti di telecomunicazioni, è impensabile che questi approcci possano sostituire il ruolo fondamentale delle infrastrutture di rete, come GARR, che consentono un trasporto dei dati a livello nazionale e internazionale.
Come riuscite a gestire dati che provengono da molte fonti? Dove sono analizzati e archiviati?
Gestire dati eterogenei provenienti da satelliti, sensori, stazioni meteorologiche e rilievi sul campo è una sfida complessa. Questi dati differiscono per formato, frequenza e qualità. Inoltre, il volume e la velocità di arrivo, soprattutto per i dati in tempo reale, richiedono infrastrutture potenti e capaci di processare grandi flussi senza rallentamenti.
Nel 2024 i disastri ambientali hanno causato oltre 3 miliardi di euro di danni. La piattaforma nazionale può avere un forte impatto sociale ed economico
Stiamo lavorando anche per attivare un canale con AGID, al fine di collaborare con le pubbliche amministrazioni per la creazione di un data model condiviso, che faciliti l’armonizzazione, lo scambio e la gestione efficiente delle informazioni. Tutti i dati vengono raccolti e archiviati nel Centro Nazionale ICSC, che dispone di sistemi di storage avanzati e sicuri. Qui si effettuano tutte le elaborazioni preliminari, sia sui dati storici che su quelli in streaming, sfruttando la capacità di calcolo dei supercomputer. Attraverso standard aperti e piattaforme intuitive, i dati saranno poi resi accessibili a ricercatori, enti e decisori in modo chiaro e semplice.
Quando si parla di dati c’è sempre un’attenzione particolare alla sicurezza...
Sì, teniamo in grande considerazione gli aspetti legati alla sicurezza e alla privacy dei dati raccolti, che richiedono competenze specifiche e multidisciplinari. Attualmente, il principale interlocutore su questo tema è ENEA, che si occupa di definire e gestire le strategie di sicurezza e protezione dei dati. In prospettiva, prevediamo di integrare le competenze interne allo Spoke 5 con quelle di un partner esterno, SoBigData, che porterà un contributo importante grazie alla sua esperienza in questo campo.
Qual è l’impatto a livello sociale ed economico?
Il progetto ha una rilevanza molto estesa che non si limita al piano scientifico e tecnologico. Secondo i dati disponibili, tra il 2019 e il 2024 in Italia oltre 110 persone hanno perso la vita e 159 sono rimaste ferite a causa di frane, alluvioni e terremoti, con danni economici diretti, stimati dal CNR-IRPI, superiori ai 3 miliardi di euro nel solo 2024, più del triplo rispetto al 2010. La piattaforma mira a ridurre drasticamente queste cifre, non solo grazie a una maggiore capacità di allerta precoce, ma anche offrendo strumenti di pianificazione che permettano di costruire infrastrutture più resilienti, ottimizzare la gestione delle risorse e garantire la continuità dei servizi essenziali.
Simulazione numerica di una evacuazione in caso di emergenza. Il codice colore misura la densità di popolazione sui percorsi e nei punti di raccolta - credits: ICSC
Quanto è importante fare squadra?
Fondamentale. La costruzione di una comunità nazionale di esperti che collaborano e condividono conoscenze specifiche su fenomeni naturali distruttivi è uno dei principali risultati già raggiunti. Ciò permette di mettere insieme competenze diverse e di formare gruppi specializzati, un passo fondamentale per affrontare le complessità di questi fenomeni in modo coordinato e multidisciplinare.
E anche guardando al futuro, l’obiettivo è completare e consolidare la piattaforma, rendendola uno strumento operativo a disposizione di istituzioni, enti di ricerca e altri stakeholder. Non meno importante è il rafforzamento delle collaborazioni sia con partner istituzionali sia con realtà private, per costruire un sistema sempre più integrato e interoperabile.
Spoke 5: una collaborazione multidisciplinare
I partner. Lo Spoke 5 si avvale di una rete solida e articolata di partner di eccellenza, che comprende atenei come l’Università di Bari, l’Università di Firenze, l’Università dell’Aquila, la Sapienza Università di Roma, il Politecnico di Bari, insieme a enti di ricerca e istituzioni quali ENEA, CNR e INGV. Questa collaborazione multidisciplinare è fondamentale per affrontare in modo efficace le complesse sfide legate alla gestione del rischio ambientale.
L’organizzazione. Per integrare le diverse competenze, lo Spoke è organizzato in gruppi di lavoro specializzati che si focalizzano su rischi specifici — come incendi, frane, terremoti — e un gruppo trasversale che sviluppa strumenti e gestisce i dati comuni. Questa struttura permette di mettere in rete le competenze e le risorse tecniche di ogni partner, favorendo la condivisione di conoscenze e lo sviluppo di una base comune solida e integrata a livello nazionale.
Il gruppo di lavoro con al centro Ester Pantaleo e il prof. Roberto Bellotti, leader dello Spoke 5 - credits: ICSC
In breve
Che cos’è lo Spoke 5 del Centro Nazionale HPC e Big Data?
È il programma dedicato a ambiente e disastri naturali: sviluppa modelli predittivi, AI e gemelli digitali per prevenire e mitigare frane, incendi, alluvioni e terremoti.
Come l’intelligenza artificiale aiuta a prevenire i disastri naturali?
L’AI analizza dati satellitari, geologici e climatici su larga scala per identificare aree a rischio e simulare scenari, supportando decisioni più rapide ed efficaci.
Qual è il ruolo del supercalcolo nello Spoke 5?
Il supercalcolo permette di elaborare enormi quantità di dati in tempi rapidi, creando simulazioni complesse e gemelli digitali del territorio per pianificare azioni di prevenzione e risposta.