Immuni, il Grande Fratello, l’immaginario tecnologico e la democrazia della conoscenza

scienza internet big data

history 18 minuti di lettura

Secondo Harari nell'evoluzione umana ha avuto un ruolo centrale la capacità di creare totem e miti, che hanno fondato la capacità di aggregare grandi gruppi di individui, costruendo dei significati condivisi e superando la dimensione del pettegolezzo che caratterizza i piccoli gruppi non solo umani. Leggendola, la tesi è molto convincente e anche molto ben documentata.

Totem e miti, dunque sono addirittura fondativi del successo della nostra specie. Il che ha avuto peso non solo agli albori della storia umana, ma arriva fino ai giorni nostri. Il confine tra scienza, magia ed esoterismo è una lunga traccia che dura migliaia di anni: per trovare tracce di un tempo in cui la magia aveva un ruolo importante nella vita di tutti, basta guardarsi intorno: osservo le gargolle del Duomo di Milano e ritrovo quelle creature fantastiche che i miei figli hanno letto nei romanzi di Harry Potter.

Man mano che le nostre conoscenze crescono, l'immaginario un po' anche si ritrae, ma soprattutto si articola. Ne sono intrisi i titoli dei quotidiani a qualunque nuova scoperta, costantemente ingigantita e resa magica, talvolta salvifica, talvolta catastrofica, secondo i gusti. Un esempio? Il secondo debutto della fusione fredda fu nel 1989 quando i chimici Stanley Pons e Martin Fleischmann annunciarono di aver ottenuto in laboratorio la fusione nucleare, in modo controllato e a “bassa temperatura”; decine di migliaia di articoli entusiasti sulla stampa mondiale con il dispiegamento delle magnifiche sorti e progressive; a una più attenta verifica risultò che avevano ottenuto energia in quantità trascurabile. Da allora decine di annunci e nessun esito plausibile.

La pervasività delle tecnologie non ha frenato lo spazio dell'immaginario, lo ha colorato. Da almeno due secoli esiste un immaginario scientifico e tecnologico evoluto, la fantascienza. Quando le tecnologie hanno iniziato a mostrare il loro potere sono apparse riflessioni e opere apertamente distopiche sul loro potenziale impatto, come 1984 o Brave New World.

Mentre le tecnologie sono sempre più nella nostra vita, la conoscenza che ne abbiamo continua ad essere bassa. Le usiamo, in parte, talvolta ne abusiamo, ma ne sappiamo pochissimo. Normalmente, tra una scoperta e il suo uso diffuso intercorre una generazione umana: servono adepti che le apprendano sin da piccoli, le includano nella loro immagine del reale, come il sole e l'acqua, cose disponibili, con cui si convive utilmente. Ma costoro sono pochi; per i più quelle tecnologie sono misteriose quanto il ciclo dell'acqua sul pianeta: impariamo ad usarle un po', ma ci rimangono misteriose, quindi sono contenitori di immaginario.

Un'attenzione spasmodica ai dati
In ogni epoca ci sono oggetti di immaginario particolarmente vividi. Nella nostra, uno importante sono i dati e ciò che si muove nell'ambito della cosiddetta data science, la scienza dei dati. Almeno nel linguaggio, un'evoluzione interessante: abbiamo smesso di parlare di computer -hardware e software, cioè strumenti- e parliamo di dati, di contenuti. Nella data science ci sono parole e concetti che riecheggiano: Data Lake, laghi di dati (dove ci immaginiamo grandi pescatori), una evoluzione dei Data Warehouse, magazzini di dati, che evidentemente non erano più sufficienti (in questo nessuna evoluzione, siamo sempre al gigantismo stile Metropolis), intelligenza artificiale (e qui lo spazio per le battute è così ampio che sembrerebbe di sparare sulla crocerossa), machine learning
Diciamo che se qualcuno ha voglia di trovare elementi di diffidenza, non fa molta fatica, vengono offerti su un piatto d'argento.
Anche qui però c'è serietà e conoscenza e c'è immaginario, più o meno interessato. La data science fa molto attentamente riferimento al metodo scientifico, ma non riesce a non propagare suggestioni immaginifiche. A contribuire ad una forte attenzione e confusione ci sono stati fenomeni come Wikileaks, gli scandali che hanno coinvolto Facebook e la cessione di dati personali degli utilizzatori, l'uso di dati personali per scopi politici ed il Russiagate, la faticosa regolamentazione del GDPR, l'ambigua soluzione del consenso informato (informato?) per l'uso dei dati personali. Il risultato è che prestiamo un'attenzione parossistica a qualcosa che non sappiamo bene cosa sia: i dati appunto. Oggetto impalpabile, quindi perfetto per uso, abuso ed immaginario.

Ma cosa sonoi dati?
Provo ad articolare la domanda.
Esistono in natura? No, non mi pare.
Sono un frutto delle attività antropiche? Andrà precisato, ma sì.
Sono oggetti tecnologico? No, solo trattabili tecnologicamente.
Sono sempre esistiti nella storia dell'umanità? Sembra di no, ma esistono da molto tempo: ad esempio, è incerto se la scrittura presso i Sumeri sia iniziata dai dati – contabilizzazione di derrate agricole- prima che dai concetti e dalle preghiere, ma comunque i dati di magazzinaggio precedono l'epopea di Gilgamesh.
I dati sono il frutto di un nostro modo di osservare il mondo? Sembra di sì. Se è così, sono potenzialmente infiniti.

Nel dizionario Treccani, “dato” è ciò che è immediatamente presente alla conoscenza, prima di ogni forma di elaborazione. Frutto di qualunque forma di osservazione, sono sempre associati a categorie descrittive: 20 è un numero, 20 anni una grandezza, 20 anni di età un dato descrittivo univoco; 5 anni di età e 5 anni di garanzia sono due dati totalmente differenti. I dati sono rappresentazioni originarie di un fenomeno, evento, effettuate attraverso simboli, o altra forma espressiva. In questo senso sono oggetti elementari di conoscenza. Senza il soggetto conoscente non esistono ed è specificamente il processo di conoscenza che li crea. In particolare, è una specifica forma della conoscenza che crea dati, quella classificatoria, mentre un mistico sufi o un sacerdote buddista, per la conoscenza cui aspirano, sanno assai poco che farsene.

Diversi metri per i dati personali
Tra i pressoché infiniti dati esistenti o conoscibili, una particolare categoria sono quelli che descrivono caratteristiche dei singoli umani, che chiamiamo dati personali, la cui quantità è enormemente aumentata di recente. 30 anni fa ognuno di noi poteva essere descritto in un numero limitato di caratteristiche, diciamo nell'ordine delle decine. Oggi ognuno di noi è descrivibile secondo migliaia, anche decine di migliaia di caratteristiche. Il motivo è semplicemente che attraverso gli strumenti che usiamo lasciamo molte tracce di noi stessi, del nostro passaggio, delle nostre abitudini, dei nostri gusti, tutte informazioni che messe assieme definiscono abbastanza bene la nostra individualità. Il che è abbastanza terribile, abbastanza in linea con la distopia del grande fratello orwelliano, da una parte, abbastanza comodo dall'altra.
Di tutte queste tracce siamo perlopiù inconsapevoli e felici di lasciarle. Siamo contenti di avere la carta sconti del supermercato, ci buttiamo a pesce nei social, ci iscriviamo a un club di servizi senza alcuna remora, dotiamo i nostri smartphone di app che ci chiedono accesso ai nostri dati, usiamo il navigatore sul cellulare comunicando a Google ogni singolo spostamento della nostra vita, con grande serenità.
Facciamo tutto ciò perché ci viene comodo, o perché scambiamo informazioni con occasioni di piacere. Per nostro piacere o comodità abdichiamo serenamente al controllo sui dati che riguardano la nostra vita quotidiana. Si può sostenere naturalmente che questo non riguarda tutti, che è una libera scelta, etc, etc. Confidiamo che quelle informazioni non verranno mai usate contro di noi o a nostro svantaggio (davvero? non è già successo? io di intromissioni nella mia vita che usassero una password usata per acquisti on line ne ho avute enne).
Il meccanismo di abdicazione è semplicemente descrivibile con una categoria del marketing: gli acquisti d'impulso. Ci facciamo prendere da un desiderio o da un'esigenza in quel momento irrefrenabile e concludiamo un contratto senza valutarne le molte caratteristiche. Alzi la mano chi legge sempre i disclaimer dei contratti, cartacei o on-line. In mezzo a quei contratti ci sono delle generiche formule che rimandano a ponderosi documenti (che non leggiamo) in base ai quali cediamo i diritti d'uso di tutti i dati personali conferiti e di quelli rilevabili con l'uso del servizio che abbiamo sottoscritto. Insomma, per procurarci dei like su Facebook sbrachiamo e diamo tutto. Che dite, centra con l'immaginario?

Abbiamo lo stesso atteggiamento verso i servizi di cittadinanza? Non mi pare. Appena è un servizio pubblico a occuparsi di dati personali si apre una questione, forse generata proprio dall'etica necessaria del servizio pubblico. Cioè, io servizio pubblico sto attento a non abusare dei dati personali e quindi sono più chiaro nella comunicazione e nei limiti e predispongo meccanismi per evitare gli abusi, li comunico; ma a quanto sembra se io sono un servizio pubblico le attenzioni non bastano mai, sono più sospetto di un servizio privato. Perché? Forse perché mi muovo in uno spazio contendibile, cosa che un'azienda è molto meno, per cui la sovra-attenzione può essere stimolata per opportunismo di parte. Ma non solo. È anche che nella maggior parte dei casi non ho alcuna carota con cui invogliarti, non farai nulla d'impulso, non riesco a prometterti nessun piacere, al massimo la difesa dei tuoi interessi e quella dei tuoi concittadini.

Stiamo assistendo in questi giorni al parossismo informativo attorno all'app Immuni, nata per il tracciamento dei possibili contatti da pandemia Covid 19. Oltre la metà della comunicazione si sofferma sul fatto che non sarà possibile usarla per scopi diversi da quelli per cui è nata e non violerà la privacy. Io su come e qualmente garantisca il tracciamento effettivo e l'abbattimento del rischio, non ho ancora capito bene, mentre ho capito benissimo tutti i livelli di volontarietà e di manifestazioni di consenso che prevede. Ciononostante, esiste una fetta di mondo che la guarda con diffidenza proprio su quel terreno. Quanta fatica! A me verrebbe da chiedermi se non ci sia un eccesso di attenzione mediatica e di attesa politica. Ci risolverà il problema del capire e prevenire il contagio? Onestamente, mi pare che Immuni sia oggetto di un doppio immaginario: positivo da una parte, per cui sarebbe una risorsa essenziale nella difesa da pandemia, negativo dall'altra, per cui sarebbe una limitazione alle libertà costituzionali.
In Veneto hanno fatto il tracciamento senza Immuni, usando qualcosa di già esistente e su cui non c'è stato nessun clamore. Si basa sull'uso pubblico di una piattaforma privata, il Digital Enabler; non si pone l'obiettivo di creare nuovi dati, ma di usare quelli esistenti, andando a trovare correlazioni nelle informazioni che già oggi ci sono. La cosa che è passata liscia e casomai è stata portata all'attenzione dei media dall'azienda fornitrice, che per l'occasione ha anche fatto un ottimo lavoro. Immuni dunque potrà aumentare, magari di molto, una capacità di tracking che già c'è.

Ci prestiamo un po' di attenzione?
La tentazione di creare il nuovo si sposa con la conoscenza imperfetta dell'esistente. In più la creazione di nuovi dati ti pone costantemente due problemi: la loro qualità (sono stati generati correttamente? Ci siamo intesi sui descrittori?) e uno di usabilità (hanno un ormato compatibile con altri? Li posso usare facilmente per verificare correlazioni?).
Il nuovo muove più economia, talvolta troppa, ma possiamo anche imparare a incrociare meglio i dati esistenti. Che significa? Rimanendo in campo sanitario, le determinanti della salute sono diffuse nel mondo che ci circonda: l'acqua che beviamo, il cibo che mangiamo, l'aria che respiriamo, l'ambiente in cui siamo immersi, naturale o antropico, i nostri comportamenti, sono tutti fattori che concorrono alla nostra salute, almeno altrettanto quanto la genetica o il caso. Basandoci su questa evidenza, ci possiamo dotare di sistemi di prevenzione, che possono funzionare piuttosto bene: il povero Costa Rica, partendo da uno sparuto Pil procapite di 17.150 $, ha investito sulla prevenzione e nella classifica OMS dell'aspettativa di vita alla nascita precede, con 79,6 anni contro 79,3, gli opulenti Stati Uniti, che dispongono di un PIL procapite di 59.500 $ (dati a parità di potere d'acquisto).

Dati ambientali e salute
Per la prevenzione le informazioni di natura ambientale sono assai rilevanti. Se dunque ci occupassimo della storia clinica di ognuno di noi, ignorando le condizioni ambientali, avremmo un meccanismo di protezione della salute privo di un piedistallo, il che avviene facilmente in paesi privi di un servizio sanitario nazionale. In questo senso lo spazio di promozione della salute che viene dalla capacità di incrociare dati di natura ambientale è fortemente accresciuto. Quando facciamo ciò, incrociamo dati personali e non, normalmente raccogliendo la popolazione in cluster abbastanza omogenei (a questo punto dati para personali, anonimizzati) e applicando ad essi le correlazioni significative. La promozione della salute sarebbe accresciuta facendo entrare nell'elaborazione gli stili di vita, che certamente sono un fatto personale, ma che non per questo devono essere lasciati allo spazio dell'ignoto, quindi dell'ignoranza: un cittadino, e un po' anche la collettività, ha diritto di sapere se alcuni stili di vita sono correlati a rischio per la salute. Alcuni esempi semplici ci sono offerti da tabagismo, dalle diete ad altro contenuto di trigliceridi, dalla pratica di sport estremi così come una vita eccessivamente sedentaria. Tutte cose personali, correlate al piacere, tutte svolte ignorando i rischi connessi. Se è complicato spiegare a un francese cardiopatico che la dieta ricca di trigliceridi non gli fa bene, hanno invece un buon accoglimento tutte le animazioni tese a promuovere stili di vita sani e sociali; ma per avviarle serve qualche informazione condivisa.

Per tornare ad Immuni ed alle altre forme di uso di dati, nel caso di Covid-19 possono essere adottati diverse piattaforme e diversi strumenti, alcuni basati su , altri no. Nessuno sa ancora bene quale sia la strada giusta, ma sappiamo che siamo di fonte e a una complessità accentuata da scarsa conoscenza, non solo del virus in sé, ma di tutte le possibili interazioni ambientali e cliniche. Lo spazio di possibile conoscenza è amplissimo, tanto da rendere palpabile il rischio di dispersione, oltretutto accentuato dalla sovraesposizione. E qui le cose si complicano ulteriormente, perché una prospettiva di conoscenza vista ex ante o ex post è completamente diversa.
Vediamo la scena. Sei davanti a una miriade di strade possibili, tutte un po' in salita; nel momento in cui ti si prospettano davanti, alcune si mostrano folli e le scarti subito, ma molte sono mediamente plausibili. Non saprai dove portano se non le imbocchi. Magari non le devi percorrere per intero, ma imboccarle, ed eventualmente tornare indietro per imboccarne una diversa, lo devi fare comunque. Sulle strade ci sono incroci (correlazioni) a te a priori ignoti. Quale è la strada giusta? Anche posto che nessuna strada è giusta per chi non sa dove andare (ma tu sai quale è il tuo scopo) le scelte che hai davanti sono moltissime. Ti rendi conto che probabilità di compiere errori è massima, non sai quanti, speri pochi. In una condizione così, se sei da solo sei fregato. Con la massima probabilità, arriverai alla meta avendo perso una parte non banale delle risorse. Attorno a te vedi soggetti che ti osservano, incitano, reclamano indicazioni, e sai che, alla fine, per i più sarà facile additare tutti gli errori che hai compiuto (chi non fa non falla). Sai anche che qualcuno di quelli è un predatore, che non aspetterà la fine, perché la meta che vedi tu manco la immagina, ti lascerà stancare un po' per attaccarti. Come la metti, non vedi modo di eliminare un rischio grandissimo.
Nel 1982 il Nobel premiava la “razionalità limitata” di H. Simon, elaborata nel '55. Ma sono passati molti anni e quindi perché non sperare in una razionalità un po' meno limitata? Una delle speranze è che le grandi masse di dati possano aiutare, possano accelerare il processo di conoscenza, darti più certezze, che alcune relazioni nascoste possano essere scoperte in maniera “automatica”, con un processo di verifica accelerato e più o meno sistematico. Mi pare che si possa descrivere così: non so ancora quali siano le ipotesi da seguire, ma siccome seguirle mi costa poco, provo a seguirne quante più possibile, anche senza ipotesi forti di partenza, e qualcosa di utile potrebbe venirmi fuori. Il ruolo centrale in questo approccio non lo hanno i dati in sé, lo hanno le loro correlazioni. Il che non ha nulla di sorprendente se pensiamo che ratiocinari, radice etimologica di ragionare, significa stabilire rapporti tra entità diverse.
È una speranza realistica o un'illusione? Al solito, dipende da come le usi. Se semplifichi troppo l'illusione è assicurata. In fondo, il metodo ti direbbe di fare ipotesi, spiegarle e verificare che tengano. Il punto più a rischio nei procedimenti automatici di machine learning, sempre più spesso associati ai big data, sembra il secondo, spiegarle. Ci fai qualcosa con delle correlazioni che soddisfano il criterio di verifica, ma di cui non sei sicuro di stabilire un senso? Poco, finché non dai loro un senso vero, che sta a te, comunque. Può anche succedere che nei processi di verifica accelerata si perda di controllo la dimensione tempo (in fondo sono accelerati) e si cerchino verifiche in tempi troppo stretti, il che espone a probabilità di errore considerevoli. E che fare quando per sviluppare nuova conoscenza serve davvero pensiero laterale? Un terreno molto complesso e non risolvibile in poche battute, qui e ora.

La suggestione comunque c'è: hai un metodo, abbastanza ben codificato e si tratta niente di meno che del metodo scientifico, hai i dati per verificare le ipotesi, hai un insieme di forme di correlazione note e documentate, sono tutte cose serissime, perché non provare a vedere se quell'insieme di cose può superare i nostri oggettivi limiti di conoscibilità? La prima risposta che viene a me è: perché eventualmente non la controlli.
Già, bel tema: il controllo, ce ne eravamo quasi dimenticati. Avevamo lasciato il nostro ipotetico esploratore a districarsi nell'intrico delle strade di conoscenza, sapendo che da solo è comunque fregato. Un piccolo pensiero laterale ci dice che il nostro potrebbe non essere solo e potrebbe essere un co-decisore. Non è l'esperienza quotidiana, visto che sulle decisioni difficili ci sono sempre più soggetti pronti a spararti addosso per opportunismo, che ad aiutare per responsabilità, e visto anche che una parte non banale di decisioni rispondono a logiche difensive più che non di problem solving, tendenza che aumenta tanto più quanto più il decisore è esposto, come spiega bene la teoria dei giochi.

Knowledge sharing
Proviamo a percorrere questo pensiero laterale. Se davvero l'esploratore non fosse solo? A me pare che lì si apra uno scenario immenso, percorso in parte in tempi recenti e molto bene. Alludo al mondo open, all'open innovation, agli open data, ai creative commons, ai protocolli di contrattualistica open attorno agli oggetti di conoscenza, e provo a mostrare che tra il mondo difensivo / competitivo e il mondo open c'è una fondamentale differenza di setting.

Proverei volentieri a sostenere che la ridefinizione di setting è una delle abilità fondamentali della politica (anche se non necessariamente dei politici di professione). Partiamo da alcune evidenze. In tempi recenti si è mostrato che processi cooperativi ed anche “coopetitivi” sono particolarmente efficienti ed efficaci: le architetture parallele dei processori lo suggeriscono, ma ormai molte innovazioni sono frutto di cooperazione, riusi e ripartenze, non solo nel campo delle tecnologie dell'informazione che le ha generate. Ancora una volta, in campo sanitario il portato di innovazione di approcci open risulta straordinario: nell'e-health buona parte delle conquiste sono figlie di processi di apertura e standardizzazione, cui simposi di hacker hanno contribuito significativamente.
La scena che propongo, e che contiene la differenza di setting, è quindi questa:
Tu e la tua comunità siete di fronte a un nuovo vasto territorio di conoscenza da esplorare, non serve fingere di conoscerlo e dominarlo, si vede che non è così. L'esplorazione è urgente e rischiosa; nella tua comunità c'è un sacco di gente che non conosci bene, ma che ti potrebbe aiutare. Allora organizzi una bella discussione in cui vi chiarite lo scopo comune. Alcuni lo vedono, altri no, magari lo temono. Allora riunisci tutti quelli che lo vedono e stabilisci con loro alcune semplici regole comuni di metodo. Ognuno percorre una strada e condivide con gli altri le informazioni che ne derivano, magari vi date un linguaggio, magari fischi modulati a distanza, così non perdete tempo nello scambio informativo e ognuno si muove in ogni momento con il massimo di conoscenza disponibile. Sapete uno dell'altro che potete sbagliare, per cui da una parte vi fidate, ma dall'altra verificate le cose non credendoci ciecamente, e vi aiutate nelle verifiche.

Se fate questo avete costruito un'organizzazione aperta, che sarà molto più veloce a trovare la strada giusta e resisterà molto meglio alle critiche dagli attacchi di chi è rimasto fuori, anzi qualcuno di quelli fuori si sentirà un po' sciocco e ci penserà su. La vostra sarà anche un'organizzazione resiliente, capace di dialogare con gli errori per apprendere, e potreste neppure rendervi conto di che valore ha. Perché qualunque tecnologia ha una sua governance, cui dare sempre un po' più attenzione che alla soluzione tecnica.

Non credo che i big data contengano una magia, non sono una soluzione, sono un'opportunità e qualche volta si riveleranno uno spreco: da sempre l'eccesso di informazione rende più difficile orientarsi per chi non sa bene cosa cercare. Una nota multinazionale quando riceveva richieste di documentazione dall'antitrust confezionava minimo 5 TIR di documenti, tutti veri, e li consegnava tutti, con il chiaro scopo di disorientare e al minimo guadagnare tempo. Quindi i dati sì sono importanti, ma possono non essere così big. Una buona esplorazione di relazioni crea più valore, poi casomai serviranno molti dati per validarle.
Credo invece che la data science sia un filone molto serio, che ha bisogno di un po' di tempo per svilupparsi e che ci insegnerà molte cose, soprattutto se la modalità con cui si svilupperà sarà una modalità aperta. Molte intelligenze vuol dire molti possibili pensieri laterali, molte sensibilità, molte opportunità. In un ambito così assicurare la reciprocità è un ingrediente essenziale perché il potenziale venga ben usato.

Bruno Coppola

canale telegram Segui il canale TELEGRAM

-----------------------------

Newsletter Iscriviti alla newsletter

-----------------------------

Se sei giunto fin qui vuol dire che l'articolo potrebbe esserti piaciuto.
Usiamo i social in maniera costruttiva.
Condividi l'articolo.
Condividi la cultura.
Grazie

In this article