Quantcast
Channel: AulaBlog
Viewing all articles
Browse latest Browse all 503

Armi di distruzione matematica ovvero quando la matematica è un'opinione

$
0
0

I Big Data
La matematica è un'opinione? Cosa sono i Big Data e con quali metodi vengono processati? Che algoritmi con quali modalità vengono processati? Quale statuto epistemologico e conoscitivo possiedono gli algoritmi che vengono adoperati per estrarre informazioni dai dati? Quali sono i pericoli e i problemi cui la costruzione algoritmica della realtà digitale produce? Come avviene la profilazione delle nostre identità digitali? Le informazioni ricavate mediante l'uso degli algoritmi costituiscono una rappresentazione oggettiva della realtà?
Si tratta di domande cruciali che costituiscono una delle principali problematiche della ricerca filosofica da sempre, con la novità che ora i dati di cui si parla on sono quelli percepiti dal soggetto umano, ma sono i dati prodotti nell'ecosistema digitale i cosiddetti Big Data. Con il termine Big Data si fa riferimento a una mole di dati talmente ampia da trascendere qualsiasi capacità di analisi, non solo le capacità di analisi della mente umana, ma anche quelle dei sistemi hardware e software utilizzati per elaborare i dati in un periodo di tempo ragionevole. Non esiste una dimensione precisa che definisca i Big Data perché le capacità di calcolo aumentano progressivamente, ma non sono comunque in grado di gestire la crescita esponenziale dei dati strutturati e non strutturati che "eccedono le capacità dei sistemi di database relazionali di catturare, immagazzinare, gestire e analizzare" (McKinsey Global Institute). 


Big Data e Information Overload
La crescita dei dati  ha prodotto il cosiddetto information overload o sovraccarico informativo, solo negli ultimi due anni c'è stato un aumento del 90% dei dati prodotti. La crescita dei dati non è solo dovuta ad un aumento della loro "quantità", secondo il modello delle 3V di Doug Laney, la crescita dei dati si misura secondo tre dimensioni:
  • Volume: quantità dei dati prodotti ogni secondo;
  • Varietà: tali dati sono eterogenei, strutturati, destrutturati di differenti formati (testi, video, immagini, disegni, audio, mail, etc.);
  • Velocità: la velocità con cui i dati vengono prodotti è in continuo aumento.

Alla crescita dei dati corrisponde la necessità per i sistemi (umani, aziendali, sociali, politici, culturali, etc.) di ottenere da questi dati delle informazioni utilizzabili. Non solo i dati aumentano per volume, varietà e velocità, ma abbiamo bisogno di ricavare sempre più informazioni da questi dati e in tempi sempre più ristretti.

Big Data Analisys
La Big data Analisys, ampiamente utilizzata in ogni ambito economico ma anche politico e scientifico, ma indirettamente anche nella vita quotidiana di ciascuno di noi, è l'insieme di metodi e procedure tramite le quali acquisire informazioni utili dai dataset (basi di dati) allo scopo di  interpretare e descrivere il passato (descriptive analytics), predire il futuro (predictive analytics) o raccomandare azioni (prescriptive analytics), Wikipedia, Big Data, Cilco di vita.
Per ricavare informazioni sono stati sviluppati diversi approcci:
  • Data Mining: tecniche per estrarre le informazioni dai dati attraverso procedure automatiche di tipo algoritmico. Consiste in un trattamento matematico e statistico dei dati alla ricerca di correlazioni e schemi per prevedere determinati comportamenti. Ad esempio conoscendo il comportamento medio dei clienti di una compagnia telefonica cerco di prevedere quanto spenderà il cliente medio nell'immediato futuro, Wikipedia, Data Mining.
  • Machine Leraning: o apprendimento automatico, è l'insieme di tecniche che utilizza metodi statistici per migliorare l'efficacia di un algoritmo nell'identificazione di modelli e schemi in un insieme di dati. Si tratta di un approccio computazionale basato su reti neurali artificiali, che consente agli algoritmi di apprendere informazioni da una base di dati e effettuare delle predizioni attraverso la produzione di modelli basati su campioni. Esempi di questo tipo sono le pubblicità personalizzate che compaiono nelle nostre pagine web, i sistemi di filtraggio delle email per bloccare lo spam, etc.
  • Basi  di dati: si tratta dio un sistema per memorizzare e gestire dati strutturati e omogenei in ambito informatico, è l'equivalente digitale di un archivio o schedario cartaceo.

La mappa non è il territorio
Gregory Bateson, in Mente e natura, intitola due paragrafi con queste frasi: "la mappa non è il territorio e il nome non è la cosa designata", "Non esiste esperienza oggettiva".  I due signori dell'immagine non potranno prendere un caffè in un bar delle ramblas, né corrono il rischio di essere investiti da un auto. Nella carta di Barcellona sopra la quale si trovano non esistono bar né automobili. La carta è un modello, una rappresentazione semplificata della realtà che non va confusa con la realtà stessa. Questa caratteristica è propria di qualsiasi sistema di rappresentazione /o conoscenza della realtà, dalle più raffinata teorie fisiche ai più banali luoghi comuni, si tratta sempre di rappresentazioni non oggettive e semplificate della realtà che spesso scambiamo con la realtà e in questi casi si generano comportamenti stupidi o pericolosi o illusori, cosa diremo se uno dei due uomini della foto volesse tuffarsi nel mare raffigurato nella cartina con il colore blu?
La stessa cosa vale anche per gli algoritmi, anch'essi costituiscono una rappresentazione semplificata della realtà che viene ricostruita in base a determinate scelte relative ai criteri e alle variabili da considerare e a quelle da scartare, al peso da dare ai vari criteri scelti, etc. Vale anzi proprio il contrario, chi elabora e utilizza questi algoritmi li costruisce basandosi sui pregiudizi della propria professione, del settore in cui opera o sui pregiudizi dominanti in una certa società e in una certa epoca. 


Armi di distruzione matematica
Questa lunga introduzione per presentare la recensionedi Rosario Paone al libro di Cathy O’Neill Armi di distruzione matematica (Bompiani, 2018). Cathy O'Neil è una scientist analyst che ha studiato e lavorato nell'ambito della analisi dei Big Data e che mette sull'avviso dei pericoli che si corrono qualora si dimentichi che gli algoritmi non costituiscono una conoscenza oggettiva ma sono opinabili, sono il risultato di un'interpretazione dei dati basata su valori, ideologie, stereotipi e pregiudizi. Non si tratta di una "denuncia da poco", dal momento che la Big Data Analisys regola e regolerà sempre di più tutti gli aspetti della vita sociale e individuale: acquisti, servizi, assicurazioni, investimenti, assunzioni, licenziamenti, retribuzioni, selezioni, ma anche la morale, i valori umani, il bene comune, etc.

La recensione di Rosario Paone
Nell'introduzione ho cercato di fornire alcune conoscenze schematiche per meglio affrontare la lettura dell'ottima recensione di Rosario Paone al libro della O'Neill di cui sono venuto a conoscenza grazie al blog di Gabriella Giudici. Il titolo dell'articolo di Rosario Paone è "Armi di distruzione matematica: come il mito dell’oggettività dei numeri rischia di rovinarci la vita" ed è stato pubblicato su Letteraturaenoi il 10/10/2018.
L'intervento di Paone riprende le tesi principali esposte nel lavoro di O'Neill ed è incentrato su tre punti principali:
  1. La potenza del linguaggio matematico;
  2. Un esempio della parzialità e del carattere non oggettivo degli algoritmi per l'analisi dei Big Data costituito dai ranking di scuole e università che imperversano in tutto il mondo, vedi i testi Invalsi o Eduscopio, il ranking messo a punto dalla fondazione Agnelli per stilare una "classifica delle scuole";
  3. Quando gli algoritmi diventano armi di distruzione matematica: gli algoritmi matematici per l'analisi dei Big Data diventano armi di distruzione (e manipolazione) di massa quando chi ne fruisce non presta attenzione alla sostanziale differenza tra modello e realtà.
L'ultimo è il punto decisivo e per chiarire il concetto O'Neill suggerisce che ci si ponga, socraticamente, tre tipologie di domande a proposito dell'oggettività delle informazioni ottenute:
  1. C'è una chiara consapevolezza del modello con cui sono costruite le procedure algoritmiche? Ovvero: sono chiare "le finalità dello strumento, il fatto stesso che sia stata operata una modellizzazione, l’algoritmo, ovvero le regole, alla base della modellizzazione)? Se non c’è questa consapevolezza, allora siamo di fronte a un’Arma di Distruzione Matematica (ADM)."
  2. Il modello è in contrasto con l'interesse di alcuni soggetti? L'esempio è quello dei casi segnalati dalla O'Neill di insegnanti licenziati per lo scarso rendimento nei test scolastici Usa, scarso rendimento dovuto, in realtà, al fatto che non avevano fatto copiare gli studenti come i colleghi che li avevano preceduti. 
  3. Il sistema può scalare? Può cioè essere esteso da un ambito più ristretto a un ambito più generale? Si può mettere in relazione l'andamento scolastico con la provenienza regionale o con l'etnia o classe di appartenenza? Questo punto e il precedente possono produrre problemi di tipo etico.
Interessante notare che, una volta affermato l'utilizzo di sistemi di ranking come quelli presenti nell'ambito della formazione scolastica e universitaria, coloro che operano nel settore tendono a conformare il loro comportamento ai criteri di modellizzazione sui quali è costruito l'algoritmo e ciò produce il rafforzamento dell'illusione di oggettività che ad esso viene ingenuamente riconosciuta.
In conclusione siano i benvenuti gli algoritmi a condizione di non scambiare le informazioni che grazie ad essi otteniamo per verità oggettiva perché la matematica può essere un'opinione e può produrre manipolazione.

Viewing all articles
Browse latest Browse all 503

Trending Articles