Antiper | ChatGPT, la verità e certe vittime dimenticate dell’Olocausto
ChatGPT è il giocattolo intelligente più in voga del momento. Si tratta di una Intelligenza Artificiale (IA) di tipo testuale che risponde in modo efficiente a domande formulate in linguaggio naturale grazie ad un addestramento eseguito su masse di dati enormi. Nonostante questo bastano domande apparentemente semplicissime per ottenere risposte assai poco intelligenti.
Gli chiediamo di fornirci dati aggregati sulle vittime dell’Olocausto ed otteniamo la seguente risposta
“Di seguito sono riportati alcuni dati aggregati sulle vittime dell’Olocausto:
Ebrei: Circa 6 milioni di ebrei furono uccisi durante l’Olocausto, rappresentando circa il 2/3 della popolazione ebraica europea al momento.
Rom (Zingari): Si stima che tra 200.000 e 500.000 Rom siano stati uccisi durante l’Olocausto.
Disabili: Circa 275.000 persone con disabilità furono uccise durante l’Olocausto.
Omosessuali: Circa 5.000 omosessuali furono arrestati e imprigionati in campi di concentramento durante l’Olocausto.
Oppositori politici: Circa 20.000 oppositori politici, tra cui comunisti, socialisti e nazionalisti, furono arrestati e imprigionati in campi di concentramento durante l’Olocausto.” (ChatGPT)
Siccome la sua intelligenza è sì artificiale, ma è pur sempre un’intelligenza, ChatGPT “si tutela” aggiungendo tre riferimenti per approfondire
“Ti consiglio di consultare fonti affidabili come il Memoriale dell’Olocausto di Washington (https://www.ushmm.org/), il Museo e Memoriale Ebraico di Berlino (https://www.jmberlin.de/en) e l’Istituto Internazionale per la Ricerca sul Genocidio (https://www.icrc.org/it/what-we-do/addressing-effects-war-and-violence/genocides-mass-atrocities) per ulteriori informazioni e dati affidabili.” (ChatGPT)
Il terzo link fornito è sbagliato e ritorna un errore (“Pagina non trovata”); si tratta del sito della Croce Rossa Internazionale che però non dev’essere molto informato sull’Olocausto dal momento che non trova nessun contenuto in caso di ricerca con parole chiave come “olocausto” o “holocaust”.
Per inciso, questo tipo di errori sono sempre possibili perché la Kowledge Base di ChatGPT è sì evolutiva ma il grosso è, attualmente, congelato al 2021. Lo abbiamo scoperto chiedendo a ChatGPT informazioni sui licenziamenti di massa che sono avvenuti nelle ultime settimane in alcune grandi imprese “Big Tech” come Google, Microsoft, Amazon…
“non posso fornirti un elenco di link specifici perché le informazioni possono essere soggette a rapidi cambiamenti e la mia conoscenza è limitata al 2021. Ti consiglio di effettuare una ricerca online” (ChatGPT)
Gli altri due link forniti come riferimento per le vittime riguardano due famose istituzioni direttamente o indirettamente gestite da esponenti della comunità ebraica internazionale. Uno di questi in particolare, il Memoriale dell’Olocausto di Washington, è anche la fonte [1] a cui si ispira la pagina Wikipedia sulle vittime dell’Olocausto [2] (molto più attendibile di ChatGPT, in effetti).
Nella pagine di Wikipedia e del Memoriale di Washington anche i prigionieri di guerra sovietici vengono conteggiati come vittome dell’Olocausto in quanto persone internate e uccise nei campi, esattamente come gli ebrei o i dissidenti politici che Wikipedia valuta nell’ordine del 10% (1 – 2 milioni) del totale e non certo i 20.000 come fa assurdamente ChatGPT.
Vittime | % | Numero (approssimativo) |
---|---|---|
Ebrei (Jews) | 42% | 6 milioni |
Polacchi, Ucraini e Bielorussi (Ethnic Poles, Ukranians & Belarusians) | 22% | 3,5 / 4 milioni |
Prigionieri di guerra sovietici (Soviet POWs) | 20% | 3 milioni |
Politici (Politicals) | 10% | 1,5 / 2 milioni |
Jugoslavi (Jugoslavia) | 3% | 320.000 / 350.000 (serbi); 20.000 / 25.000 (sloveni) |
Rom | 2% | 196.000 / 300.000 |
Disabili (Disabled) | 1% | 250.000 / 270.000 |
Altri (Other) | 1% | 5.000 / 15.000 (omosessuali); 1 900 (testimoni di Geova); piccoli gruppi di afro-europei; ecc. |
Group | Number of Deaths | |
Jews | 6 million | |
Soviet civilians | around 7 million (including 1.3 Soviet Jewish civilians, who are included in the 6 million figure for Jews) | |
Soviet prisoners of war | around 3 million (including about 50,000 Jewish soldiers) | |
Non-Jewish Polish civilians | around 1.8 million (including between 50,000 and 100,000 members of the Polish elites) | |
Serb civilians (on the territory of Croatia, Bosnia and Herzegovina) | 312,000 | |
People with disabilities living in institutions | up to 250,000 | |
Roma (Gypsies) | between 250,000 and 500,000 | |
Jehovah’s Witnesses | around 1,900 | |
Repeat criminal offenders and so-called asocials | at least 70,000 | |
German political opponents and resistance activists in Axis-occupied territory | undetermined | |
Homosexuals | hundreds, possibly thousands (possibly also counted in part under the 70,000 repeat criminal offenders and so-called asocials noted above) |
Senza sviluppare tutta l’analisi delle differenze è evidente che ChatGPT ha sparato dati a casaccio. Quello che interessa qui è avanzare ipotesi sul perché questo sia avvenuto.
C’è naturalmente una classica interpretazione complottista. Le grandi società che stanno dietro a ChatGPT (Microsoft, Tesla, Linkedin…) semplicemente partecipano in modo attivo all’opera di riscrittura della storia (particolarmente rilevante in questa epoca di guerra tra NATO e Russia); un’opera che si concretizza, tra le altre cose, nella cancellazione del contributo dell’Armata Rossa e delle Resistenze partigiane alla liberazione dal nazifascismo e nella cancellazione dei prigionieri di guerra sovietici e degli oppositori politici dal novero delle vittime del nazismo. Il tutto nel quadro di una riscrittura storiografica più generale che tende a scaricare sull’URSS persino la responsabilità per l’avvento del nazifascismo in Europa e per tutte le disgrazie che ne sono seguite.
Si tratta di un’interpretazione che coglie sicuramente un punto della questione. Ma in relazione a ChatGPT è necessario aggiungere un problema ulteriore ovvero il problema del rapporto con la verità dei sistemi di conoscenza collaborativi e di massa (ChatGPT e le IA che verranno, ma anche Wikipedia).
Ci torneremo in modo più ampio in un contributo ulteriore; ci basti qui considerare che le AI costruiscono la propria Knowlwdge Base e le proprie inferenze sulla base di una fase di pre-addestramento (“Pre-Trained” è la parola che corrisponde alla lettera P dell’acronimo GPT) e dal continuo successivo raffinamento in fase di esercizio.
Interrogato su sé stesso ChatGPT risponde
“Il modello è stato addestrato su una vasta quantità di testo proveniente da internet, comprese conversazioni, articoli, libri, e altri documenti. Questo gli permette di comprendere il significato delle parole e di costruire relazioni tra di esse per generare risposte coerenti e significative.” (ChatGPT)
Il modello si addestra in base a ciò che trova in rete. E qui nasce un problema: la rete è sempre affidabile? La risposta è: dipende. Se si tratta di lemmi di carattere scientifico-matematico normalmente le risposte sono convergenti (non ci sono interpretazioni diverse del Teorema di Pitagora e solo per una percentuale nanoscopica della popolazione mondiale la Terra è piatta); se invece si tratta di lemmi a carattere politico o storico o filosofico, nei quali esistono interpretazioni diversissime e contrastanti, quella che emerge è l’interpretazione dominante, il “senso comune” – la doxa – piuttosto che la verità.
Lo riconosce la stessa ChatGPT quando le si chiede se, essendo addestrata con dati presenti in rete, non sia possibile che le sue risposte siano influenzate dal “senso comune” e quindi possano risultare inaccurate
“è possibile che le risposte di ChatGPT siano influenzate dalla quantità e dalla qualità dei dati che sono stati utilizzati per addestrarlo. Poiché ChatGPT è stato addestrato su una vasta quantità di testo presente su Internet, comprese conversazioni, articoli, libri e altri documenti, le sue risposte possono essere influenzate dal “senso comune” e dalle opinioni presenti in rete” (ChatGPT)
“poiché i modelli di linguaggio come ChatGPT sono soggetti ai pregiudizi e alle discriminazioni presenti nei dati di addestramento, è importante essere consapevoli di queste possibili influenze e valutare la risposta del modello in modo critico” (ChatGPT)
Quella del rapporto spesso conflittuale tra verità e doxa è una “vexata quaestio” che ha origini antichissime e che è stata usata spesso in modo “aristocratico” per liquidare il sapere popolare e considerare vero solo il sapere elitario (dei filosofi piuttosto che dei sacerdoti piuttosto che degli scienziati: c’è sempre una élite che pretende di essere depositaria del sapere). Ma quello dalla diffusione del sapere resta un problema reale che non va liquidato con atteggiamenti populistici (la verità “del popolo” contro quella “dei professoroni della sinistra”).
A questo punto viene da domandarsi se l’IA, oltre a concorrere probabilmente alla riscrittura della storia, non sia anche e soprattutto vittima di questa stessa riscrittura. A forza di nascondere i prigionieri sovietici e gli oppositori politici – diciamo, per semplificare, i “comunisti” – l’ideologia dominante istruisce la doxa popolare e di riflesso le IA che non riescono a rilevarne il ruolo storico e politico finendo per alimentare ulteriormente, in un infinito circolo vizioso, questa forma di negazionismo particolarmente odiosa.
Dunque, anche le IA sono vittime dell’ideologia e più che come super intelligenze finiscono talvolta per funzionare come semplici moltiplicatori del senso comune, spesso quanto di più lontano vi sia dalla verità.
Note
[1] Wikipedia scrive “Percentuali e numero delle vittime dell’Olocausto secondo i dati dello United States Holocaust Memorial Museum”
[2] Wikipedia, Vittime dell’Olocausto