In Spagna centinaia di migliaia di donne hanno raccontato in rete violenze e molestie usando l'hashtag #Cuéntalo, diventato virale in poco tempo dopo una sentenza che derubricava uno stupro di gruppo a un reato minore. I risultati e la portata del progetto informatico che li ha monitorati
La Spagna del #Cuéntalo
in 2,7 milioni di Tweet
L'indignazione narrata sulle reti sociali a volte può diventare qualcosa di concreto. L'arcipelago fluido di sdegno può essere raccolto, ordinato e restituito come informazione, utilizzando un modello di trattamento archivistico integrale per le fonti documentali sociali, senza alcuna rilevazione diretta, accettando la sfida di preservare e gestire in modo partecipativo le informazioni generate collettivamente sul web.
È accaduto in Spagna quando, ad aprile 2018, la sentenza sul caso La Manada, una violenza sessuale di gruppo avvenuta a Pamplona, è diventata un caso giudiziario per la decisione del tribunale di derubricare lo stupro a un reato minore, l'abuso sessuale. Sentenza inaccettabile per le donne spagnole che, per protesta, hanno iniziato in migliaia a raccontare in rete i casi di aggressione e abusi sessuali subiti, gli stupri, la paura, la rabbia.
È stata una giornalista a pubblicare il primo tweet con l'hashtag #Cuéntalo (raccontalo) con il quale incoraggiava a dare visibilità ai casi di violenza maschile sulle donne. In pochi giorni sono stati oltre due milioni e mezzo i tweet e retweet di storie di abusi e violenze raccontate dalle protagoniste.
Il BSC (Barcelona Supercomputing Center) ha deciso di raccogliere e analizzare i dati emersi dai tweet, e ha poi pubblicato i risultati realizzando il Progetto #Cuéntalo, accessibile a tutti. Una mole di informazioni monitorata e raccolta in collaborazione con AAC-GD Asociación de Archiveros y Gestores de Documentos de Catalunya (l'associazione archivisti della Catalogna). Quasi 15 Gb di tweet contrassegnati con l'hashtag #Cuéntalo, monitorato per due settimane, sono stati raccolti e convertiti dal formato originale del file in formati riutilizzabili per l'analisi dei dati.
È stato disegnato un database con 2,75 milioni di tweet, corrispondente a 790mila utenti digitali, 12,8 giga byte di informazioni. Forse è un fatto che dice poco, ma mostrando che 160mila sono le storie originali e che, di queste, circa 50mila sono testimonianze in prima persona, i numeri dicono di più.
Dei 50.000 tweet che raccontano in prima persona, 1 su 10 riporta un omicidio; 1 su 7 uno stupro; 3 su 10 un assalto sessuale; 1 su 6 un abuso; 1 su 3 parla di molestie; in 1 su 3 viene menzionata la paura di uscire o di camminare senza compagnia.
In totale, sono stati segnalati più di 3.500 stupri o aggressioni sessuali a minori di 18 anni. E più di 1.000 abusi su bambini sotto i 12 anni che sono stati coinvolti in molestie e violenze. Molte di queste storie sono state raccontate per la prima volta.
I dati geografici hanno rivelato che il 34% dei messaggi proviene dalla Spagna e il 32% dall'Argentina, l'8% dalla Colombia e il 5% dal Cile e dal Messico.
A differenza del #MeToo, l'hashtag utilizzato a seguito delle denunce contro le violenze del caso Wieinstein, #Cuéntalo è stata una interruzione del silenzio sulle violenze maschili che ha visto come protagoniste donne per lo più anonime, dal momento che il 75% delle utenti che hanno narrato le violenze subite ha meno di 3.000 follower su Twitter.
L'obiettivo dell'indagine era quello di studiare i tweet statisticamente e visualizzarli graficamente per trasmettere l'impressionante grandezza del fenomeno, ma la quantità di dati raggiunge un altro obiettivo meno statistico: diventa un luogo senza paura o imbarazzo dove sono raccontare in prima persona le testimonianze brutali delle violenze vissute da donne che a volte, solo attraverso un tweet, sono riuscite a parlarne. La rete diventa quindi un luogo dove poter dire quello che spesso si tace per vergogna, perché anche se accade ciò che non viene nominato non esiste. È stato così che l'hashtag #Cuéntalo si è trasformato in uno spazio virtuale contro la violenza machista, una memoria collettiva per dimostrare la veridicità delle denunce e la dimensione di un conflitto. In un paese come la Spagna dove molti casi di stupro non vengono denunciati diventa importante portare alla luce fatti che accadono ogni giorno e che non vengono conteggiati in nessun registro, sia per paura, o peggio, perché la società non ci crede.
Una prima distinzione è tra i 160 mila i tweet con contenuto scritto dalle/dagli utenti e il resto delle voci che sono retweet e like. Sebbene i retweet siano cruciali per amplificare le informazioni, e vengano considerati come supporto implicito, il contenuto che si è voluto esaminare è stato quello dei tweet originali.
Questi 160 mila tweet sono stati suddivisi in quelli in cui le autrici danno testimonianza delle proprie esperienze, quelli in cui le autrici raccontano a nome di chi non osa o non può farlo (ad esempio, perché non ha la possibilità di accedere a una rete internet o non utilizza un computer, o perché purtroppo sono donne già assassinate), e quelli in cui le autrici esprimono parole di stupore o sostegno nei confronti di altre donne. Alcuni tweet inclassificabili (pubblicità, immagini) sono stati scartati, come un piccolo gruppo di troll o tweet digitati da persone che hanno fatto battute.
Per classificare i 160 mila tweet originali è stato esaminato manualmente il contenuto di 10.600 tweet scelti a caso, con l'obiettivo di definire un algoritmo che li classificasse automaticamente per una corretta elaborazione, utilizzando il maggior numero possibile di categorie.
Si è iniziato con le più evidenti: omicidio, stupro, violenza sessuale, maltrattamenti, molestie, la paura (come menzione esplicita) e le emozioni di disgusto, la tristezza, la rabbia o l'indignazione.
Questa categorizzazione dell'informazione nel suo insieme è risultata troppo complessa e articolata per definire un algoritmo, quindi, per raggiungere una prima visualizzazione dei dati, è stata pensata una aggregazione con solo tre macro categorie: la violenza fisica (omicidi, stupri, violenza sessuale e abusi), le aggressioni non fisiche (molestie, intimidazioni) e la reazione emotiva (disgusto, rabbia).
Tuttavia il lavoro di categorizzazione manuale non è avvenuto invano, poiché la metodologia utilizzata ha permesso di stimare le percentuali di tweet simili raccolti nel set di dati completo.
Dei 10.632 tweet codificati manualmente, il 31% è in prima persona, quelli in seconda persona sono un 8,91%, 40,18% invece sono tweet di supporto, un 3,12% di tweet sono contro il movimento, e un 16,69% sono quelli non assimilabili. Le percentuali estrapolate sul totale dei tweet, avrebbero un errore che va dal 1,5% per quelli contro, a un 3% per le prove, e quasi un 6% per i tweet di supporto.
All'interno dei tweet che sono testimonianze in prima o seconda persona (quasi il 40%), il 3,92% parla di un omicidio, il 5,59% di stupro, l'11,18% di violenza sessuale, il 6,27% di abuso 14,19% di molestie, 11,78% di paura e 19,23% di disgusto, rabbia, tristezza (le percentuali non si sommano a 100 perché nello stesso tweet si può parlare di diverse cose).
Ancora una volta, la metodologia utilizzata ha reso possibile enucleare queste percentuali dal globale con un margine di errore del 1% in caso di omicidi e stupri, del 3% per le aggressioni, i maltrattamenti e le molestie e del 6% per le categorie di paura e indignazione.
L'algoritmo individuato è stato in grado di etichettare i tweet del database con una precisione dell'80% per le categorie di chi scrive in prima o seconda persona e una precisione pari al 70% per il tema dei tweet secondo le tre categorie semplificate.
Per la visualizzazione delle informazioni, è stata scelta la rappresentazione circolare, una figura che evoca sicurezza o protezione e che facilita la lettura dei circa 130mila tweet.
La posizione all'interno del cerchio rappresenta il tipo di messaggio. Dall'interno verso l'esterno, secondo le categorie individuate dall'algoritmo: al centro o nell'arco interno le testimonianze in qualche modo protette dal resto dei tweet a sostegno della causa. I tweet più estranei sono quelli sistemati più lontani dal centro.
Ogni tweet di testimonianza o supporto è rappresentato con un punto nello spazio, complessivamente si forma un layout che travolge per la sua ampiezza, dando l'idea delle ripercussioni del fenomeno. L'individualità di ciascun tweet è salvaguardata e si rileva con l'uso del mouse. Il cerchio si legge come un orologio, per ricordare che tutto questo è qualcosa che accade in ogni momento della giornata e in tutto il mondo. I singoli tweet sono organizzati secondo l'ora in cui sono stati digitati. La tavolozza dei colori scelta, dal bianco al rosso, parla della violenza del soggetto, e mostra una scoperta analitica molto interessante: ogni tweet è colorato indipendentemente dalla sua posizione, con i punti più rossi in cui si stima si parli di aggressività fisica e quelli bianchi che parlano di aggressioni di altra natura. Il risultato è che la maggior parte dei tweet che parlano di aggressività fisica coincidono con i tweet che si trovano nel centro perché sono le testimonianze delle violenze subite.
La visualizzazione rende subito la dimensione del fenomeno ed è un documento storico che compone una nuova memoria collettiva della violenza maschile, narrata dalle parole delle stesse donne. Il progetto #Cuéntalo è un esempio di democratizzazione della tecnologia di archiviazione, fornisce una serie di soluzioni tecnologiche e pratiche partecipative, utili per trasformare questo tipo di patrimonio documentario digitale in un materiale di riflessione e cambiamento e contribuisce alla generazione di una necessaria consapevolezza sociale.
Di fronte all'immediato futuro, la squadra di analisti sta cercando la collaborazione con diverse istituzioni per costruire una metodologia a medio e lungo termine che, utilizzando come modello l'archiviazione partecipativa (dalla valutazione alla descrizione documentaria), permetta l'inclusione di processi di sfruttamento automatizzato di dati di massa e la diffusione dei risultati.
A tal fine sono già stati contattati il governo spagnolo, il parlamento europeo, la Generalitat della Catalogna e i comuni di Barcellona, Madrid e Saragozza.
Leggi anche
Un anno di#MeToo. Il costo delle molestie