Immigrati e numeri.
Circola un assurdo dibattito “numerico” sui giornali,nei relativi commenti e nel mondo della politica. Si tratta di confrontare il numero di reati commessi da italiani e stranieri, per decidere che o se gli stranieri siano, o meno, sovra-rappresentati.
Avendo (dice il ministero) la maggioranza italiana (il 91% della popolazione) che commette il 70% circa dei reati, e' chiaro che gli stranieri, in termini assoluti, siamo sovra-rappresentati nella popolazione carceraria.
La soluzione sembrerebbe semplice, ma: ma c'e' un problema. Il problema e' che , per far quadrare i conti, occorrerebbe che le due popolazioni siano uguali.
Immaginate per esempio di essere una casa farmaceutica e dover misurare se un certo farmaco dia un certo effetto collaterale mortale. Allora fate i due gruppi, uno lo chiamate “italiani” e uno lo chiamate “stranieri”. Solo che gli stranieri sono in gran parte uomini, e sono in media 15 anni piu' giovani degli italiani.
E' ovvio che ci saranno molti meno morti se abbassate l'eta' media di 15 anni, perche' avete tagliato fuori gli anziani, rispetto al campione “italiani”, che ne contiene molti.
Ma quanto e' grosso questo sbaglio, nel senso che, fare questo confronto ha senso, cioe' misurare la prevalenza in questo modo ha senso?
Abbiamo , per eta' e composizione di genere, due dati molto diversi. Usero' quindi un criterio del chi-square per la composizione di genere, mentre cerchero' di calcolare il “ro” (ρ) riguardo all'eta' media.
sono due test semplici, che quasi tutti i software di statistica implementano.
Caratteristica | Immigrati africani | Italiani |
---|---|---|
Età media | ~32 anni (d=18) | 46,9 anni (d=68) |
Uomini | 62% | 48,7% |
Donne | 38% | 51,3% |
Questi due insiemi, anche se non abbiamo la distribuzione della popolazione per eta', ha due piccoli problemi. Per prima cosa, come fanno nel mondo del farmaceutico, calcoliamo i “ro” (ρ) che ci dira' se i campioni sono correlabili o meno ,
- Solo per le eta' medie, ρ ≈ 0.188 . Mi spiace, troppo.
Gia' per le eta' medie, considerando la deviazione standard nei due casi (il carcere si comincia dopo i 14, e si finisce ai 72 come eta' massima di punibilita' carceraria in entrambi i casi) i due campioni sono troppo scorrelati e non si possono confrontare “con una semplice proporzione”.
- per la storia del numero diverso di donne e uomini dovremmo eseguire un test del chi-square, e capire se abbia senso fare un confronto.
Facendo due calcoletti (potete usare R per farli, se volete) e considerando che il fattore di liberta' e' uguale ad uno (due righe, due colonne),
Somma delle Statistiche Chi-Quadrato = 5.952 Valore critico per df=1: circa 3,841.
Dal momento che 5.952 e' superiore a 3.841, non possiamo confrontare i campioni , tantomeno le prevalenze o la rappresentativita', di due campioni tanto diversi.
Quindi mi spiace dirlo, ma state facendo un confronto del cazzo tra due popolazioni troppo diverse. Una cosa del genere non sarebbe accettata in nessun trial farmaceutico.
E' un confronto del cazzo, tutto qui. Per fare errori del genere, nelle universita' si perdono esami.
Dateci un taglio.
Uriel Fanelli
Il blog e' visibile dal Fediverso facendo il follow a:
Contatti:
- Fediverse: @uriel@fedi.keinpfusch.net
- MATRIX: @uriel:mtrx.keinpfusch.net
- GNU JAMI: ufanelli