di
Enzo Grossi
Centro Diagnostico Italiano, Milano
Introduzione
Uno spartiacque è la linea che separa (fuori dal Nord
America) i bacini di drenaggio confinanti. In un territorio
collinare, lo spartiacque si trova lungo le vette e le catene
montuose topografiche, ma in un territorio pianeggiante (specialmente
dove il terreno è paludoso) lo spartiacque può
essere invisibile - è solo una linea più o meno
immaginaria che divide il territorio, sui cui lati le piogge
alimenteranno corsi d'acqua differenti, percorrendo confini
diversi di una regione o di un continente.
Lo spartiacque continentale dell'America è noto a
livello mondiale. Tuttavia, nessuno mai considera la presenza
di uno spartiacque continentale europeo. Mentre per l'America
la suddivisione sembra più ovvia (le coste dell'Atlantico
o del Pacifico, sebbene nessuno mai parli dello spartiacque
del Pacifico o dell'Artico!), in Europa la suddivisione potrebbe
essere fra le due più ampie masse d'acqua che delimitano
il subcontinente: l'Atlantico e il Mediterraneo.
Questa suddivisione fisica (quindi obbiettiva) è interessante
di per sé, in quanto alcuni paesi considerati del Mediterraneo,
in realtà si affacciano per lo più sull'Atlantico
(il Portogallo interamente e la Spagna quasi del tutto), altri
considerati dell'Europa centrale in realtà rimangono
completamente all'interno del bacino del Mediterraneo, come
l'Ungheria, o quasi interamente (come la Slovenia e l'Austria).
Anche la Germania ha un'ampia frazione della sua area all'interno
dello spartiacque del Mediterraneo. La figura 1 rappresenta
gli spartiacque europei.
Figure 1: Gli spartiacque europei
Prendiamo per esempio lo spartiacque francese. " La
ligne de partage des eaux" attraversa il paese da nord
a sud. Sul lato sinistro dello spartiacque tutta l'acqua confluisce
verso l'oceano Atlantico, mentre sul lato destro l'acqua confluisce
verso il mare Mediterraneo o nuovamente nell'oceano Atlantico
quando incontra un altro spartiacque riguardante la Germania
( figure 2). Uno schema simile si può applicare al
territorio spagnolo.

Figure 2: Ligne de partage des eaux
Non conoscendo l'esistenza di questa linea sarebbe molto
difficile anticipare la traiettoria dell'acqua che ha origine
da due sorgenti a ridosso dello spartiacque, una a pochi metri
sulla sinistra e l'altra a pochi metri sulla destra, anche
tenendo in considerazione la topografia dettagliata del paese
in 3D ottenuta con sofisticate tecnologie GIS. Le sorgenti
situate a pochi metri l'una dall'altra potrebbero dare origine
a fiumi che seguiranno un destino opposto: uno si riverserà
nell'oceano Atlantico e l'altro nel mar Mediterraneo.
Lo spartiacque come metafora nel contesto medico
Il concetto di spartiacque di un territorio pianeggiante
può essere utilizzato come metafora dello scenario
riguardante i concetti di salute e malattia. Nel panorama
medico noi potremmo pensare alle sedi delle sorgenti come
equivalenti del patrimonio genetico di una persona al momento
della nascita. I fiumi diventano il decorso della vita delle
persone, o, in termini fisici, le loro non lineari "linee
dell'universo": ovvero la serie continua e unidimensionale
di eventi che rappresentano la storia di un soggetto. Il mare
in cui i fiumi alla fine confluiscono rappresenta l'esito,
per esempio una sana vecchiaia vs una morte prematura causata
da una malattia cronica.
Se l'obiettivo principale della medicina predittiva è
quello di anticipare la futura evoluzione della vita di una
persona sulla base dei dati disponibili, allora secondo questa
metafora il problema è di predire quale sarà
la direzione del fiume considerando il luogo della sorgente
in un determinato territorio e i dati ambientali disponibili.
Due fiumi le cui "sorgenti" sono molto vicine possono
facilmente percorrere due traiettorie in direzioni opposte.
Un fiume può confluire verso il mare Mediterraneo (buon
esito: sana vecchiaia) mentre l'altro confluirà verso
l'oceano Atlantico (cattivo esito: ad es. insorgenza del cancro).
Considerando, come abbiamo detto prima, che le sorgenti possono
essere intese come la predisposizione genetica dei soggetti,
si potrebbe assumere che una sorgente molto vicina al Mediterraneo
potrebbe rappresentare un esito altamente probabile. Dato
il punto di partenza, il destino delle persone (il fiume)
sarà poco influenzato dagli eventi della vita o da
stili di vita particolari (colline, montagne, catene montuose).
Pensiamo ad esempio a Winston Churchill: a dispetto del fatto
che fosse un leggendario golosone con 39 di BMI, incredibilmente
pigro, e gran fumatore, morì serenamente all'età
di 90 anni mentre dormiva.
La stessa cosa accade ad una sorgente molto vicina all'oceano
Atlantico (cattiva predisposizione genetica); non importa
quali misure preventive la persona adotti, il suo destino
sarà inevitabilmente segnato. Pensiamo per esempio
a Jim Fix, il profeta dello jogging, un corridore maratoneta,
promotore di uno stile di vita sano, non fumatore, con un
BMI di 23, che morì per un infarto miocardico a 52
anni mentre stava correndo.
Questi sono esempi di situazioni estreme in cui evidentemente
erano in gioco background genetici giacenti sulle code di
distribuzione dei patterns presenti in una determinata popolazione.

Figure 3: paesaggio virtuale della "fitness" in
cui le due traiettorie esistenziali ad un certo punto prendono
due direzioni opposte, una si dirige verso un destino eccellente,
e l'altra verso un destino povero.
Predisposizione genetica e valori predittivi dei fattori
di rischio
Attualmente, malgrado l'incredibile sviluppo delle tecnologie
utilizzate per i test genetici, definire la predisposizione
genetica di un soggetto rimane ancora un obiettivo incerto.
I progressi tecnici e scientifici hanno prodotto una rapida
crescita di studi sull'ampia associazione dei genomi (GWA),
e portato all'identificazione di associazioni multiple di
malattie genetiche per le malattie comuni, nonché ad
una vasta disponibilità nel mercato di test per determinare
la presenza o l'assenza di varianti genetiche che hanno mostrato
avere un legame con particolari malattie. I sostenitori della
genomica personalizzata credono che le informazioni sui rischi
genetici delle malattie comuni rappresentino un prezioso strumento
per la salute.
Sfortunatamente, malattie multifattoriali comuni, come la
depressione, il cancro e le malattie cardiovascolari, coinvolgono
in genere molte interazioni altamente complesse gene-gene
e gene-ambiente, in modo che anche quando vi siano forti evidenze
a sostegno di un legame fra una particolare variante genetica
e il rischio di sviluppo di una data malattia, esso rappresenti
solo uno dei fattori all'interno di un processo patologico
scarsamente compreso e molto complesso. Bisogna inoltre considerare
che gli individui non sono in grado di comprendere e interpretare
pienamente le informazioni di rischio, che conducono ad una
confusione potenziale.
Così, quando si affrontano dei profili genetici appartenenti
ad una coda di distribuzione, paradigmatici di una sana vecchiaia
o di una malattia degenerativa cronica, ma che consistono
in un una variante della parte interna della distribuzione,
i medici o gli esperti di genetica si mostrano molto incerti
nel definire il possibile esito di un determinato soggetto.
In altre parole, ad oggi, fatta eccezione per le situazioni
limite (come quelle probabilmente rappresentate dai casi di
Churchill e Fix) non siamo capaci di risalire in modo efficace
attraverso gli esami sulla predisposizione genetica ad una
precisa localizzazione delle sorgenti originarie dell'uomo,
e data questa localizzazione al futuro corso del fiume riguardo
ai mari d'interesse. Ciò significa che per formulare
un probabilistico punto di vista siamo costretti ad assumere
che i luoghi siano largamente distribuiti attorno allo spartiacque
in una specie di "area grigia". Nel caso di due
fiumi che hanno origine in luoghi molto vicini allo spartiacque,
la predisposizione genetica diventerebbe molto sensibile ai
fattori incidentali: una collina (ad es. esposizione ad un
ambiente tossico) potrebbe divergere il corso del primo fiume
verso il mare Mediterraneo, mentre una catena montuosa (ad
es. dieta salutare, astinenza dal fumo) potrebbe determinare
il corso dell'altro fiume indirizzandolo verso l'oceano Atlantico.
Le terapie possono essere viste come la possibilità
di cambiare la geografia territoriale mediante un intervento
meccanico sulla configurazione del terreno. Un trattamento
specifico potrebbe influenzare, se realizzato in tempo, il
futuro corso del fiume, deviandolo nella direzione opposta.
Con gli interventi iniziati in ritardo, sarebbe molto difficile,
se non impossibile invertire la direzione del fiume.
All'interno dell'area grigia il luogo della sorgente necessita
oggi di essere completato dalla geografia del territorio (i
fattori di rischio) affinché sia significativo nella
predizione dell'esito futuro di un determinato soggetto. Ma
all'interno dell'area grigia i fattori di rischio sono spesso
difficilmente interpretabili. Solo in presenza di vette ben
visibili e di catene montuose (fattori di rischio ben definiti)
noi potremmo anticipare la traiettoria del fiume predicendo
abbastanza accuratamente l'esito del soggetto. Nella medicina
clinica gli algoritmi predittivi lavorano molto bene solo
in situazioni estreme. Se noi pensiamo per esempio alla valutazione
del rischio cardiovascolare, la percentuale di rischio calcolata
su 10 anni, uguale rispettivamente al 2% in un determinato
soggetto e all'80% in un'altro, tende ad essere abbastanza
attendibile. Sfortunatamente, il 70-80% della popolazione
ha un indice di probabilità che sta in una posizione
intermedia rispetto ai valori di rischio molto alti o molti
bassi.
Predire il corso del fiume
Nel contesto geografico conoscere solo la posizione delle
sorgenti dei fiumi in un territorio pianeggiante senza conoscere
le loro traiettorie rende molto difficile tracciare gli spartiacque.
Avremmo solo dei punti senza che le traiettorie ci diano un'idea
della direzione, e avremmo la necessità di sapere esattamente
tutta la geografia del territorio con un altissima risoluzione
spaziale e un'esecuzione in 3D per sperare di tracciare uno
spartiacque.
Teoricamente, data una determinata posizione geografica della
sorgente di un fiume in un contesto ambientale specifico e
dato un certo numero di vincoli correlati al tipo di caratteristiche
fisiche del territorio, c'è un ottima soluzione che
minimizza la distanza fra il punto della sorgente e il mare.
Tuttavia, dal punto di vista informatico, è un compito
quasi impossibile definire la futura direzione di un fiume,
in quanto richiede l'enumerazione di molte possibili combinazioni.
Di conseguenza nella pratica, soluzioni approssimative, benché
sub-ottimali, sono ottenute attraverso una varietà
di metodi.
Una situazione simile si riscontra nella medicina clinica
quando abbiamo soltanto la condizione di partenza di un gruppo
di soggetti. Malgrado la molteplicità di caratteristiche
e di variabili disponibili, la complessità dell'ambiente
renderebbe molto difficile calcolare lo spartiacque mediante
gli approcci lineari e definire la quantità delle possibili
interazioni fra i fattori fisici. Solo osservando l'intera
traiettoria di quei fiumi, seguendoli durante tutta la loro
vita, potrebbe essere possibile tracciare in modo induttivo
lo spartiacque.
Questo è il fondamentale contributo delle indagini
epidemiologiche, come lo studio di Framingham per esempio,
che raccoglie i dati in modo prospettico in una determinata
coorte di soggetti nel corso della loro vita.
Sfortunatamente queste indagini sono molto difficili da
realizzare in quanto richiedono tempo e molte risorse finanziarie.
La sfida futura è quella di tracciare lo spartiacque
di un territorio pianeggiante (l'area grigia della salute
e della malattia) conoscendo soltanto la posizione della sorgente
di ciascuna persona e le sue interazioni reali con l'ambiente.
Se noi potessimo tracciare con un alto grado di accuratezza
questo complesso e non lineare spartiacque, valutando centinaia
di migliaia di punti di partenza (nuovi casi) potremmo facilmente
anticipare l'esito futuro di un nuovo soggetto dall'inizio,
solo conoscendo la sua posizione nel panorama della salute
e della malattia senza aspettare un esame successivo. Questa
è la sfida dell'intelligenza artificiale in medicina:
tracciare lo spartiacque partendo da istantanee di molti singoli
casi, cioè sviluppare un film da molte diverse fotografie
scelte in modo randomizzato.
In altre parole predire la traiettoria di un fiume che nasce
nel centro di un territorio pianeggiante assomiglia allo sforzo
per la comprensione delle regole che sottostanno alle complesse
interazioni fra i fattori ambientali, genetici e biologici,
sostanzialmente responsabili di un certo tipo di evoluzione
dello stato di salute di un singolo soggetto.
Comprendere le linee dell'universo e le regole che lo
governano attraverso le reti neurali artificiali
L'osservazione statica dei dati basilari attraverso l'approccio
statistico classico ci offre una visione incompleta dell'evoluzione
di un organismo vivente e dei fenomeni biologici sottostanti.
Sarebbe come cercare di capire le regole che disciplinano
il football americano esaminando un migliaio di istantanee
scattate in momenti diversi durante un migliaio di partite.
Le regole del gioco rimarrebbero quasi sicuramente oscure.
Le reti neurali artificiali, si avvantaggiano della capacità
matematica di decodificare dinamiche altamente non lineari,
permettendo di ricostruire e simulare le interazioni di variabili
multiple una volta stabilita la complessa funzione che lega
insieme le istantanee disponibili. In altre parole una rete
neurale artificiale ben addestrata può ricostruire
il film partendo da diverse istantanee relative a partite
diverse, oppure potremmo anche dire che queste istantanee
possono essere utilizzate per analizzare la semantica di una
serie di punti definiti all'interno di un elevato spazio dimensionale.
Le figure successive cercano di schematizzare i concetti sopra
esposti.

Figura 4 a: Il concetto di spartiacque applicato a quello
di salute e malattia. I punti raffigurati corrispondono al
patrimonio genetico dei soggetti. E' molto difficile tracciare
lo spartiacque in un'area grigia a meno che non sia possibile
seguirne le traiettorie per un lungo periodo.

Figura 4 b. Lo spartiacque può essere facilmente raffigurato
disponendo delle traiettorie del corso della vita.

Figura 4 c. Tracciare gli spartiacque. La sfida reale è
tracciare la linea dalla figura 4 a.
Gli sforzi delle nuove riviste mediche impegnate nella descrizione
dei singoli casi vanno in questa direzione. Le riviste potrebbero
creare un gigantesco e affidabile database di ciò che
accade ai singoli soggetti piuttosto che alle popolazioni
di soggetti, assemblando anche un enorme quantità di
variabili, purché sia utilizzato un motore di ricerca
sofisticato potenziato dagli strumenti dell'intelligenza artificiale,
che possa offrire realmente la possibilità di tracciare
lo spartiacque fra la condizione di salute e malattia. Questa
è la sfida futura della medicina predittiva.
Appendice: una breve descrizione del concetto di Reti
Neurali Artificiali
Cosa sono le reti neurali artificiali (RNA)? Offrire una
semplice spiegazione non è facile, tuttavia si potrebbe
dire che sono un insieme di equazioni matematiche ricorsive
interconnesse secondo un principio ispirato a processi altamente
non lineari che governano il cervello umano.
In modo simile al cervello, le reti neurali sono capaci di
riconoscere degli schemi, utilizzare dei dati e soprattutto
imparare attraverso degli esempi, esattamente come fa il medico
nella prima fase della sua attività.
Le regole dell'apprendimento che sottostanno alle reti neurali
sono basate su principi matematici e su teorie recenti sviluppate
negli ultimi venti anni.
Le RNA sono capaci di gestire simultaneamente un numero molto
elevato di variabili nonostante la loro non linearità
intrinseca. Questo rappresenta uno straordinario vantaggio
rispetto ai modelli statistici classici in una situazione
in cui la quantità di informazioni disponibili è
enormemente accresciuta e domina la non linearità .
Con le RNA non si è interessati al numero effettivo
di variabili né alla loro natura.
Data la loro particolare infrastruttura matematica, le RNA
non hanno limiti nella gestione di una quantità crescente
di variabili che costituiscono il vettore di ingresso per
gli algoritmi ricorsivi.
Quando si segue l'approccio tradizionale per l'analisi di
dati multifattoriali, soltanto un fattore è in buona
sostanza fatto variare nel tempo, mentre gli altri sono tenuti
costanti. E' questo il caso delle tecniche statistiche multivariabili
o multivariate classiche come la discriminante lineare o la
regressione logistica. Con queste tecniche le interpretazioni
combinate di una data serie di fattori predittivi potenziali
riguardo ai singoli soggetti risultano difficili, a causa
dei limiti imposti dai legami non lineari sottostanti e dalle
interazioni complesse fra i fattori in studio.
Le RNA possono invece gestire simultaneamente fattori multipli,
combinando e ricombinandoli in modi diversi in base a specifiche
equazioni non lineari. La differenza, in termini di valori
predittivi e del numero dei parametri predittivi modellati,
sta essenzialmente nel fatto che le tecniche statistiche convenzionali
rivelano solo parametri che siano significativi per l'intera
popolazione, mentre le RNA includono parametri che potrebbero
non raggiungere la significatività per l'intera popolazione,
ma sono altamente significativi all'interno di un sottogruppo
o di un singolo individuo.
Le RNA si differenziano dai normali programmi informatici
digitali grazie alla loro capacità di classificare
e analizzare i problemi:
· che sono intrinsecamente complessi e di ampie dimensioni,
· che hanno molti dati in ingresso,
· per i quali salde e veloci regole non possono essere
facilmente applicate, e
· che si distinguono per la ripetitività dei
compiti.
Le RNA sono un valido aiuto nella medicina predittiva per
la loro abilità nel costruire modelli flessibili e
dinamici grazie alla capacità di generalizzare e assumere
decisioni partendo da dati di ingresso ampi e spesso indistinti.
|