Il nuovo modello di Google DeepMind mira a svelare i misteri del “DNA spazzatura”, la vasta porzione del genoma che non codifica proteine ma ne regola l’attività, influenzando l’insorgenza di numerose patologie.

[In pillole] La sintesi per chi va di fretta:
Google DeepMind ha rilasciato il codice sorgente di AlphaGenome, un modello di IA che analizza la parte non codificante del nostro DNA. Lo strumento, già usato da migliaia di ricercatori, promette di accelerare la comprensione di malattie come il cancro e patologie neurodegenerative, posizionando Google al centro della ricerca genomica del futuro.
Un modello per decifrare il “lato oscuro” del genoma
Per comprendere la portata di AlphaGenome, bisogna guardare più da vicino come funziona e cosa lo distingue dai suoi predecessori.
Il problema principale nell’analisi del DNA non codificante è la sua vastità e la complessità delle interazioni. I modelli precedenti erano costretti a un compromesso: o analizzavano sequenze corte con alta precisione, perdendo il contesto generale, oppure esaminavano sequenze lunghe ma con una risoluzione inferiore, incapaci di cogliere i dettagli a livello della singola “lettera” del DNA.
AlphaGenome supera questo limite grazie a un’architettura ibrida.
Come spiegato sul blog di DeepMind, il modello combina strati convoluzionali, efficaci nel riconoscere piccoli pattern ricorrenti, con i trasformatori, la stessa tecnologia alla base di modelli linguistici come ChatGPT, che sono capaci di mettere in relazione informazioni a grande distanza lungo la sequenza. Questo gli permette di operare con una risoluzione a livello di singola coppia di basi, mantenendo al contempo una visione d’insieme su tratti molto estesi del genoma.
Le prestazioni dichiarate dall’azienda sono notevoli.
Nei test di valutazione, AlphaGenome ha superato i migliori modelli esistenti in 22 valutazioni su 24 nell’analisi di singole sequenze di DNA e ha eguagliato o superato i concorrenti in 24 su 26 test sulla predizione degli effetti delle varianti genetiche. È importante sottolineare che è stato l’unico modello in grado di predire simultaneamente tutte le diverse funzioni genetiche valutate.
Questa capacità poliedrica è ciò che lo rende così potente: invece di fornire una singola risposta, offre un quadro completo delle possibili conseguenze di una sequenza di DNA, un po’ come se, leggendo una frase, un sistema potesse analizzarne contemporaneamente la grammatica, il significato letterale, il tono emotivo e le possibili interpretazioni metaforiche.
L’utilità pratica di questo approccio è stata dimostrata in diversi studi. In un esempio significativo, i ricercatori hanno usato AlphaGenome per studiare una mutazione associata a una forma di leucemia, la leucemia linfoblastica acuta a cellule T. Il modello ha predetto correttamente che la mutazione avrebbe attivato un gene vicino, chiamato TAL1, creando un sito di legame per una specifica proteina, replicando con precisione un meccanismo già noto alla scienza.
Questo non solo conferma la validità del modello, ma apre alla possibilità di utilizzare AlphaGenome per indagare le cause genetiche di malattie ancora poco comprese, accelerando la ricerca e, in futuro, lo sviluppo di terapie mirate. Il modello si integra inoltre con un altro strumento di DeepMind, AlphaMissense, che si concentra invece su quel 2% del genoma che codifica per le proteine.
Insieme, i due sistemi offrono una copertura quasi totale del genoma umano, uno strumento formidabile nelle mani dei ricercatori.
Ma la vera domanda è se questa potenza predittiva si tradurrà in una reale comprensione biologica.
L’innovazione tecnica e le promesse di DeepMind
La disponibilità di uno strumento così avanzato ha suscitato un notevole interesse nella comunità scientifica, ma le reazioni, come spesso accade in questi casi, non sono uniformi. C’è un ampio consenso sul fatto che AlphaGenome rappresenti un passo avanti significativo.
Anshul Kundaje, un genomista computazionale della Stanford University, lo ha definito “un genuino miglioramento in quasi tutti gli attuali modelli all’avanguardia per l’analisi della funzione delle sequenze”. La sua valutazione è condivisa da molti colleghi, che vedono nel modello la capacità di spostare la ricerca genomica da un piano puramente teorico a uno di utilità pratica. Secondo le reazioni raccolte dallo Science Media Centre, Robert Goldstone, a capo del settore genomica al Francis Crick Institute, ha confermato la solidità del modello dopo averlo testato con oltre mezzo milione di nuovi esperimenti.
Tuttavia, non mancano le voci che invitano alla cautela e sottolineano i limiti attuali della tecnologia. Kristian Helin, amministratore delegato dell’Institute of Cancer Research di Londra, pur riconoscendo AlphaGenome come un “grande progresso”, ha fatto notare che il modello incontra ancora difficoltà nel catturare la regolazione genica specifica per i diversi tipi di cellule, un aspetto fondamentale per comprendere come una stessa mutazione possa avere effetti diversi in tessuti differenti.
È un po’ come avere una mappa stradale incredibilmente dettagliata, ma senza le informazioni sul traffico in tempo reale: la mappa è corretta, ma non basta per predire con esattezza i tempi di percorrenza.
Helin ha tracciato un parallelo con AlphaFold, un altro celebre modello di DeepMind che ha rivoluzionato la biologia strutturale, suggerendo che il pieno impatto di questi approcci si vedrà solo nel tempo.
– Leggi anche: Google Chrome si evolve con Gemini per navigare al posto tuo
Ancora più specifica è la critica di Xianghua Li del King’s College di Londra, secondo cui, sebbene la capacità di fare molte previsioni simultaneamente sia preziosa, il modello per ora non scopre nuove dinamiche biologiche, ma piuttosto organizza e interpreta dati esistenti con una precisione senza precedenti.
Inoltre, ha evidenziato una debolezza importante: la difficoltà nel predire gli effetti di varianti genetiche molto rare, per le quali semplicemente non esistono abbastanza dati per addestrare l’intelligenza artificiale in modo efficace.
Questo è un punto centrale, perché molte malattie genetiche sono causate proprio da queste varianti rare.
La potenza predittiva di AlphaGenome, quindi, sembra essere direttamente proporzionale alla quantità di dati disponibili, un limite intrinseco a molti sistemi di machine learning. Di conseguenza, l’entusiasmo per le sue potenziali applicazioni cliniche deve essere temperato dalla consapevolezza che il percorso per tradurre queste previsioni in diagnosi o terapie efficaci è ancora lungo e richiederà ulteriori progressi.
Il parere della comunità scientifica, tra entusiasmo e cautela
Il rilascio del codice di AlphaGenome segna senza dubbio l’inizio di una nuova fase per la genomica computazionale. La possibilità per chiunque di utilizzare, modificare e migliorare il modello accelererà la sua adozione e probabilmente porterà a scoperte che oggi non possiamo prevedere.
DeepMind stessa ha già delineato i prossimi passi, che includono l’estensione del modello ad altre specie oltre all’uomo e al topo, e l’integrazione di ulteriori tipi di dati per rendere le previsioni ancora più accurate.
L’obiettivo a lungo termine è chiaro: creare un modello fondamentale della biologia, un sistema capace non solo di predire, ma forse un giorno di spiegare i complessi meccanismi della vita a partire dal suo codice fondamentale.
Tuttavia, è importante mantenere uno sguardo critico.
La democratizzazione promessa da DeepMind è reale, ma avviene all’interno di un quadro in cui le grandi aziende tecnologiche stanno assumendo un ruolo sempre più centrale nella ricerca scientifica di base, un tempo dominio quasi esclusivo di università e istituti pubblici. La disponibilità di strumenti come AlphaGenome dipende dalla strategia e dalle priorità di un’azienda privata, che, per quanto illuminata, risponde a logiche di mercato.
Come indicato da Nature Asia, l’espansione delle capacità del modello è una delle priorità, ma non è chiaro come verranno gestite questioni delicate come la proprietà dei dati e delle scoperte derivate dall’uso del modello.
In definitiva, AlphaGenome è uno strumento straordinariamente potente, un progresso che permette di esplorare il nostro DNA con una profondità prima inimmaginabile. Ha il potenziale per accelerare la comprensione di innumerevoli malattie e per guidare lo sviluppo di nuove terapie.
Ma non è una soluzione definitiva.
È una base su cui costruire, uno strumento che, come ogni strumento, sarà tanto più utile quanto più la comunità scientifica saprà usarlo con consapevolezza, interrogandone i risultati, riconoscendone i limiti e contribuendo a migliorarlo.
La vera sfida, ora, non è più solo tecnologica, ma consiste nell’integrare queste capacità predittive nella pratica della ricerca biologica e clinica, trasformando una grande promessa in un beneficio concreto per la salute umana.



