Il progetto di ricerca sull’analisi del microblog di Mario Cimino

cimino141
Uso della stigmergia per identificare argomenti di discussione sociale in un evento specifico. Nei social media in cui gli argomenti di discussione non sono assegnati staticamente, come nei microblog, esiste la necessità di identificare e separare gli argomenti di un dato evento. Il problema può essere affrontato utilizzando un nuovo tipo di somiglianza, calcolata tra i termini maggiormente utilizzati nei messaggi.
Le occorrenze di tali termini sono periodicamente campionate dal flusso di messaggi in arrivo. Le serie temporali generate sono elaborate utilizzando la stigmergia, un meccanismo di ispirazione biologica in grado di produrre aggregazione scalare e temporale delle informazioni. Più precisamente, ciascun campione della serie genera una struttura funzionale, detta impronta stigmergica, associata ad una certa concentrazione. Le concentrazioni si disperdono in uno spazio scalare evaporando nel tempo. Depositi multipli creano una traccia quando i campioni sono vicini in termini di istante di tempo e di valore, e come tale persistono maggiormente rispetto ad una impronta isolata.
Per misurare la somiglianza tra le serie temporali, si adopera il coefficiente di similitudine di Jaccard tra due tracce. Il processo completo è gestito da una serie di unità di calcolo chiamate Unità Recettive Stigmergiche, diversificate a riconoscere diversi archetipi di micro-similarità, e disposte in un’architettura multistrato per fornire misure di macro-similarità tra serie temporali. Gli argomenti di discussione sono generati da tale misura di similarità in un processo di clustering utilizzando mappe auto-organizzanti, e sono rappresentati tramite una nuvola colorata di termini. Il meccanismo proposto funziona se i parametri strutturali sono correttamente regolati per ciascun tipo di archetipo e per ogni strato.
A questo scopo, viene usato un meccanismo di adattamento basato sula evoluzione differenziale. Per studiarne l’efficacia, l’approccio proposto è stato applicato per analizzare gli argomenti di discussione verificati su Twitter durante l’attacco terroristico di novembre 2015 a Parigi.