Il Tirreno

Livorno

Nei Big Data è racchiuso il senso di tutti i discorsi

di MAURIZIO TESCONI
Nei Big Data è racchiuso il senso di tutti i discorsi

MAURIZIO TESCONI. Volume. Velocità. Varietà. Sono le caratteristiche principali dei Big Data, raccolte di dati così grandi e complesse da richiedere appositi strumenti di elaborazione. Una delle...

3 MINUTI DI LETTURA





MAURIZIO TESCONI. Volume. Velocità. Varietà. Sono le caratteristiche principali dei Big Data, raccolte di dati così grandi e complesse da richiedere appositi strumenti di elaborazione.

Una delle fonti più ricche di Big Data è oggi costituita dai social media, piattaforme online in cui gli utenti si scambiano i contenuti e le opinioni più disparate. Ogni giorno sui social media, sempre più velocemente, sono condivise tipologie di dati sempre più ricche: il loro volume è in costante aumento. Solo in Italia, Facebook, il social network più diffuso al mondo, ha 26 milioni di utenti attivi e su Twitter sono prodotti 100 milioni di nuovi tweet al mese. Raccogliere, interpretare e rendere fruibili questi dati in modo chiaro ed efficace è una nuova frontiera della ricerca.

Nel gruppo Web application for the Future Internet dell’Istituto di informatica e telematica del CNR di Pisa studiamo quotidianamente, con tecniche all’avanguardia, il flusso crescente e continuo di dati dei social media per comprendere meglio i fenomeni della vita reale.

La politica è tra i temi più discussi su queste piattaforme, ottimi strumenti di partecipazione “dal basso”. Nel mare magnum delle opinioni e dei contenuti scambiati però non è facile trovare una sintesi e farsi un quadro preciso di ciò che avviene. È possibile orientarsi analizzando i dati prodotti: ad esempio misurando la capacità dei politici di coinvolgere le persone, individuando gli argomenti più discussi o il politico che maggiormente si è aperto al confronto con i cittadini.

Per questo, abbiamo sviluppato sistemi di monitoraggio che raccolgono informazioni in tempo reale. L’enorme mole di dati raccolta è analizzata con tecniche di data mining e visualizzata sfruttando moderne tecnologie di data visualization. Disponiamo inoltre di un sofisticato tool per l’elaborazione del linguaggio naturale predisposto dal gruppo ItaliaNLP Lab, coordinato da Felice Dell’Orletta, dell’Istituto di Linguistica Computazionale del CNR di Pisa.

Per questo progetto abbiamo sviluppato un’applicazione web che consente ai giornalisti del Tirreno e ai ricercatori di Scienze Politiche di analizzare in dettaglio i dati raccolti, tramite grafici interattivi dell’attività “social” dei soggetti monitorati.

Questi strumenti visualizzano l’evoluzione nel tempo di misure di interesse giornalistico come, ad esempio, la quantità di post prodotti giornalmente, l’indice di interattività o l’incremento di popolarità e consentono di effettuare confronti per individuare somiglianze e differenze di trend.

In un mondo in cui i dati dei social media rappresentano una fetta significativa del volume di dati sul web, in cui gli utenti spendono in media alcune ore al giorno sul proprio profilo virtuale, è chiaro che i social media attirano sempre più l’attenzione del mondo della ricerca, per le sfide tecnologiche che pongono e per gli studi sui rapporti sociali, l’economia, la politica e il modo di fare marketing. Con gli strumenti sviluppati dal CNR cerchiamo di dare uno sguardo a questo mondo e di far luce sulle implicazioni che l’uso dei social media sta portando nelle nostre vite.

Primo piano
Ambiente

Mare toscano sempre più caldo: anomalia record, +6,2°C oltre la media - Quali sono gli effetti e i rischi

di Francesca Ferri
Estate in Toscana