È vero che i follower su Twitter seguono la legge di Benford, come suggerito dalla serie Connected che ci ha portato ad approfondire questo tema?

Cosa succede se, preso un account Twitter, andiamo a verificare quanti follower seguono a loro volta i follower di quell’account? Anche in questo caso, salvo non vi siano forzature di sorta, stiamo parlando di un grande insieme di numeri che ricopre un vasto range tra 0 e centinaia di migliaia.

Una ricerca condotta da Jennifer Golbeck, menzionata anche nella serie trasmessa su Netflix, ha analizzato i numeri di migliaia di profili di vari social media identificando una relazione anche in questo caso con la legge di Benford. La ricerca le ha permesso di verificare una corrispondenza tra alcuni numeri che caratterizzano gli account di Twitter e la legge in questione. Golbeck ha anche individuato, tra gli account che non rispettavano le percentuali di ricorrenza delle singole cifre previste da Benford, un gruppo di bot russi.

L’analisi è risultata vera per Twitter, ma anche Instagram e Pinterest.

Qui vi proponiamo un semplice esercizio, sulla scia di quanto fatto con i comuni piemontesi.

Dai dati sui follower di un account Twitter alla legge di Benford

Ecco, anche in questo caso, alcuni passaggi utili. Esistono molti modi per ottenere i follower (e il numero dei loro follower) di un account Twitter (ossia chi segue un determinato account). Cosa essenziale è però avere un account Twitter.

Il modo più semplice per effettuare il nostro test è però quello di utilizzare un servizio gratuito che permette di scaricare i dati di account con meno di 5.000 follower. Abbiamo utilizzato questo, gratuito, che permette, immesso il nome di un account, di ottenere un file .xlsx con i dati dei follower di quell’account.

Una volta ottenuta la colonna dei follower gli step da effettuare sono gli stessi previsti per i comuni piemontesi.

Nel nostro esempio abbiamo preso in considerazione un account seguito da 3545 follower. Tra questi alcuni si sono rivelati a loro volta privi di follower e quindi sono stati rimossi dal set di dati. Abbiamo quindi considerato un insieme di 3428 dati, ottenendo i risultati di Tabella 1.

CIFREOCCORRENZEPERCENTUALI OTTENUTEPERCENTUALI ATTESE
199328,98%30,10%
260117,54%17,61%
342312,34%12,49%
435710,42%9,69%
52808,17%7,92%
62336,80%6,69%
72276,62%5,80%
81865,43%5,11%
91273,71%4,58%

Tabella 1

Anche in questo caso possiamo rappresentare graficamente i dati e vedere, graficamente, di quanto si discostano dalla legge di Benford.

Utilizzando strumenti come R, e utilizzando in maniera opportuna le API messe a disposizione da Twitter è possibile verificare se i numeri di follower dei nostri follower seguono a loro volta la legge di Benford e così via…

Se riuscite a fare qualche test… scriveteci!