Immagino si tratti di una nuova deformazione professionale, iniziata da quando mi occupo di “big data” e di machine learning. Cosi’ , ogni volta che mi interrogo sul progressivo divorzio degli italiani dalla realta’, cerco le spiegazioni osservando alcuni fenomeni in un modo nuovo, ovvero osservando le modifiche nel linguaggio, perlomeno nel linguaggio dei mass media.

Ho provato ad usare un pochino di dati presi da un crawler,e per esercitarmi un pochino con Spark ho provato a fare dei conticini. E se esamino bene il linguaggio suddividendolo in categorie , cioe’ dividendo il dizionario in diversi gerghi, quello che vedo e’ un linguaggio che parla di guerra.

“Combattere”? E contro chi? L’incendio e’ finito. Semmai c’e’ da ricostruire.

Si tratta di un’espressione banale, abbastanza facile da capire in momenti drammatici. Il problema viene quando si va a misurare la tendenza su grandi moli di dati, e si scopre che parole come “lotta”, “combattimento”, “bombardamento” stanno proliferando. La stessa invenzione delle “bombe d’acqua”, per esempio, inserisce forzatamente un termine prettamente militare in un discorso nato per descrivere una pioggia torrenziale. Certo, si trattera’ pure di fenomeni estremi, ma in termini di volumi d’acqua, dovremmo descrivere l ‘ India come “Hiroshima e Nagasaki d’Acqua”?

Il punto e’ che la lingua di oggi e’ diventata inadeguata a descrivere la realta’. Se il lessico comune medio e’ di 500 parole, e ci infiliamo cinquanta termini presi dal dizionario militare, abbiamo gia’ occupato il 10% del lessico.

E’ interessante come il resto del lessico sia poi stato inquinato da termini tipici della “rivoluzione”, e da moltissimi termini tipici della giurisprudenza e dei processi penali. Anche qui, il problema dell’effetto sulle masse e’ che se l’uomo medio ha un lessico di 500 parole e ci iniettiamo dentro altri 50 termini che vengono dal mondo dei processi penali, abbiamo gia’ raggiunto un venti per cento di termini alieni.

Perche’ dico alieni?

Dico “alieni” perche’ la stragrande maggioranza degli italiani non vive in uno stato di guerra ne’ e’ soggetto a processi penali. Se pero’ le masse colorano la realta’ con discorsi pieni di termini militari o di espressioni tipiche della lotta al crimine, la sensazione generale, il feeling, sara’ quello di vivere in un paese stracolmo di bombardamenti, lotte, scontri, combattimenti, nonche’ di accuse, difese, aggravanti, attenuanti, condanne.

Non sono tra quelli che credono nel linguaggio come IL generatore della realta’. Tuttavia, esiste un proverbio americano che dice “if all you have is a hammer, everything looks like a nail”. E se tutti gli strumenti di relazione personale sono inquinati da guerre e processi penali, l’ipotesi che il paese diventera’ piu’ litigioso e violento potrebbe avere una sua consistenza logica.

Ma non sono i soli”inquinamenti”. Perche’ a quanto pare, gli italiani discutono molto, ma molto, di economia. A quanto pare i termini tipici dell’economia sono a loro volta entrati nel linguaggio, occupando una quantita’ grande del lessico. Ma il problema e’ il melting pot: perche’ l’economia in teoria verte sull’incontro fra la domanda e l’offerta di qualcosa (senza questo dubito ci sarebbe “economia”) , ma se discutiamo di economia usando termini di guerra, quello che otteniamo e che l’economia stessa si colora della dialettica di guerra.

Di conseguenza, gli italiani che parlano di economia tenderanno a dipingerla con sfumature sempre piu’ forti di guerra.

Tutto gira attorno alla misera quantita’ di vocaboli a disposizione dell’italiano medio. Siamo attorno ai 500. Ed e’ in queste condizioni che se inseriamo anche pochi termini di guerra, pochi termini di cronaca nera e anche pochi termini di economia, otteniamo una descrizione della realta’ che inevitabilmente e’ una specie di Jungla fatta di scontri, attacchi, difese, crimini, complotti , strategie , assalti, rapine e chi piu’ ne ha piu’ ne metta.

In Italia, parte del divorzio dalla realta' consiste, a mio avviso, nella contaminazione del lessico.

I mass media, tutti, hanno iniziato ad usare un lessico sempre piu’ contaminato da termini che provengono da ambiti specifici, sino a creare una specie di creolo fatto di militarismo, crimine, economia, catastrofismo. A volte noto il fatto che il termine “stupro” ricorra molto piu’ di “fidanzamento”, e mi chiedo quando i giovani italiani cominceranno a chiedere alle ragazze di poterle stuprare: quando la parola “fidanzamento” sara’ sparita dal lessico, e le sole parole rimaste per descrivere le relazioni amorose saranno mediate dalla pornografia, in che modo si scrivera’ una lettera d’amore?

Questa deviazione del linguaggio, peraltro, ha effetti strani anche sul mondo del deep learning. Per esempio, la politica sui social sta facendo un uso tremendo dei chatbot. I chatbot sono di per se’ applicazioni poco costose, che possono reggere conversazioni di base dopo aver imparato un pochino delle risposte piu’ comuni.

Mi e’ capitato di fare un esperimento: sono entrato in un thread pieno di chatbot, e ho insultato un tizio chiamandolo (anche) “sicofante”, in una risposta piuttosto piccata. Ai tempi di Usenet, quando avevi a che fare sempre e solo con persone, una simile risposta altezzosa e piccata avrebbe creato una quantita’ grande di risposte da parte degli altri partecipanti al thread.

Ma la stragrande maggioranza dei sostenitori di Lega e M5S, sui social network, sono chatbot. Solo il 2% di loro e’ umano, e supervisiona la botnet. Come risultato, quel post non ha avuto risposta. Ha avuto risposta lo stesso identico post, ove avevo sostituito il termine “sicofante” con “leccaculo”. Quindi la risposta di per se’ era “triggering” portava reazioni. In passato, una sola parola desueta non avrebbe fermato il thread.

Ma essendo i chatbot addestrati solo sul misero lessico quotidiano degli italiani, non sapevano come rispondere ad un post nel quale la parola “sicofante” aveva un peso molto alto nel “sentiment”. Di conseguenza hanno taciuto. Tutti.

E’ interessante notarlo perche’ in realta’ le “incredibili strategie ” e “gli algoritmi vincenti” che si stanno usando sono estremamente deboli. Non solo queste reti non riescono a reagire ai memi,

ma non riescono nemmeno ad interpretare un linguaggio inconsueto o una risposta che viene pensata in una lingua diversa e poi tradotta. Sono limitati al loro addestramento, e sono addestrati su esempi che si riferiscono ad un lessico di 500 parole.

Adesso consideriamo un’altra proporzione: su 500 parole di lessico, dopo aver inserito guerra, pornografia, cronaca giudiziaria , economia e calcio, aggiungiamo anche qualche decina di insulti.

La domanda e’ : ma se gli italiani dovessero cooperare, in che lingua dovrebbero farlo? Dispongono di un linguaggio utile a cooperare, e se si, quanto utile?