Un’intelligenza artificiale di Google DeepMind ha imparato a identificare le mutazioni nel DNA legate a malattie genetiche
Il gigante di intelligenza artificiale Google DeepMind ha sviluppato l’algoritmo AlphaMissense per prevedere gli effetti delle mutazioni missenso nel DNA umano.
Il nuovo strumento potrebbe essere molto utile per la diagnosi e lo sviluppo di terapie, soprattutto per le malattie rare.
Amminoacidi e mutazioni del DNA
Gli amminoacidi, i mattoni costitutivi delle proteine, vengono determinati da triplette di nucleotidi, gli elementi fondamentali del genoma.
Quando, a causa di una mutazione genetica, queste triplette vengono alterate (perché una base del filamento di DNA viene sostituita con un’altra), nella proteina viene inserito un amminoacido diverso da quello richiesto. Si parla in questo caso di mutazione missenso (o missense): la proteina così prodotta può funzionare in maniera diversa da quella prevista oppure può non funzionare affatto.
Conseguenze concrete
Le mutazioni di questo tipo sono imprevedibili e valutarne le conseguenze è stato finora molto difficile.
La maggior parte sono innocue, ma alcune possono essere pericolose perché predispongono allo sviluppo di patologie. Da mutazioni di questo tipo hanno origine, ad esempio, malattie genetiche come la fibrosi cistica o l’anemia falciforme.
Ad oggi solo il 2% delle oltre 71 milioni di varianti missenso individuate nel genoma umano è stato classificato come benigno o patogeno, mentre nella maggioranza dei casi restano ancora da scoprire le conseguenze dal punto di vista clinico.
Si stima che ogni persona tende a presentare circa 9000 mutazioni missenso nel proprio corredo genetico. Buona parte di esse è fortunatamente innocua.
L’intelligenza artificiale
I ricercatori di DeepMind, guidati da Jun Cheng, hanno sviluppato l’algoritmo AlphaMissense utilizzando l’intelligenza artificiale.
Sfruttando la conoscenza acquisita da Alphafold (una IA che è in grado in poco tempo di prevedere ogni tipo di struttura che una proteina assumerà a partire dalla sequenza amminoacidica), riesce a “intuire” se una proteina mutata sembra “naturale” oppure no; e, nel secondo caso, stabilisce quanto può essere dannosa quella mutazione assegnandole un punteggio di rischio.
«È come se sostituissimo una parola in una frase in inglese, e una persona che conosce bene l’inglese potesse capire immediatamente se la sostituzione ha il potenziale di cambiare il significato della frase» spiega Žiga Avsec, scienziato di Google DeepMind.
L’addestramento dell’IA
AlphaMissense è stato addestrato utilizzando dati sul DNA umano e di primati strettamente imparentati con l’uomo al fine di identificare le mutazioni missenso comuni, che probabilmente sono benigne, distinguendole da quelle più rare e potenzialmente dannose. Il programma ha anche studiato milioni di sequenze proteiche per comprendere il “linguaggio” delle proteine sane.
Una volta addestrato, l’algoritmo è stato in grado di valutare le mutazioni missenso generando un punteggio che indica la probabilità che causino malattie.
Risultati e prospettive future
AlphaMissense è stato in grado di analizzare e classificare l’89% delle 71 milioni di mutazioni missenso, e ha previsto che il 57% di esse potrebbe essere innocuo, mentre il 32% potrebbe causare malattie (mentre sulla parte restante non ci sono certezze).
Gli esperti sottolineano che il sistema è ancora da affinare e occorrerà del tempo per renderlo affidabile dal punto di vista clinico. Ma l’utilizzo dell’intelligenza artificiale potrebbe avere un impatto significativo sulla diagnosi e lo sviluppo di terapie per le malattie genetiche, soprattutto quelle rare.