

6
DICEMBRE/GENNAIO 2018
RIFLESSI DAL FUTURO
METODO INDUTTIVO E MITIZZAZIONE
DEGLI ALGORITMI: LE BANALIZZAZIONI
DA EVITARE NELL’APPROCCIARE
IL PATRIMONIO DI DATI OGGI DISPONIBILE
L’
entusiasmo per i Big Data è maggiore nei
convegni che non tra coloro che hanno
la strumentazione per trattarli. Con una
analogia ardita potremmo dire che si tratta in un at-
teggiamento analogo a coloro che sono entusiasti della
guerra imminente, pur non avendone mai combattuta
una, e i militari di professione che ne conoscono le
conseguenze e sono i più restii ad iniziarla.
La sovrabbondanza di informazioni non significa di per
sé un aumento del sapere. Anzi, quasi sempre, un’eson-
dazione di dati distrugge certezze generando dubbi e
problematiche impreviste. Ne sannoqualcosa gli astrono-
mi che, ad ogni missione satellitare, si trovano di fronte
a incongruenze e a grosse questioni irriconciliabili con
le teorie in uso. Ciò equivale a dire, riportando tutto al
marketing, che senza criteri interpretativi i Big Data
Big Data:
riflessioni
scettiche
di Amagi (Tirelli Associati)
Pro e contro,
qualche esempio
Tuttavia, dopo questa icastica premessa
cerchiamo di cogliere le effettive opportunità
della crescente produzione e disponibilità di
dati che verrà offerta alle aziende che opera-
no nel mercato. Un primo aspetto riguarda
il miglioramento della capacità previsiva di
fenomeni a rapida evoluzione e non lineari.
Un esempio riguarda il lavoro di ricerca del
professor Apurva Jain della Washington
University. Nel 2013, una giovane azienda di
nome American Giant, propose sul proprio
sito Internet un nuovo modello di hoodie, la
tipica felpa con cappuccio che indossano i
giovani nelle stagioni invernali. Il risultato fu
un successo “catastrofico”. In meno di due
giorni dall’annuncio gli ordini ricevuti sul sito
furono di 500.000 $ e tali da rendere quasi
impossibile il loro espletamento. Il professor
Jain, esperto di ricerca operativa è dunque al
lavoro per elaborare modelli che consentano
di simulare questi trend rapidissimi e altamen-
te non lineari. La soluzione (tuttora non conso-
lidata) sembra venire dall’incrocio dei segnali
anticipatori raccolti su Google e su Facebook
in termini di citazioni e visite con l’andamento
reale degli ordini effettuati sul sito.
Ovviamente per evitare il famoso problema
del “garbage-in-garbage-out”, i dati devono
essere accuratamente ripuliti e valutati nella
loro rappresentatività. Il Professor Jain cerca
di valutare pazientemente la stabilità dei
segnali leads & lags, affinché ciò che è valido
in un caso non fallisca miseramente in altri.
Si tenga conto poi che il problema illustrato
è relativamente semplice se rapportato a
ciò che può accadere in quell’ottica di omi-
channel che tanto piace ai nuovi “guru” del
trade-marketing. Basti notare che il problema
della raccolta simultanea e del cleaning dei
segnali è mostruosamente più complesso. I
Big Data non debbono servire ad alimentare
ex-post un’apologetica dei casi di successo,
ma amigliorare effettivamente le performance
attese di un’azienda!
Un “buco nero” della nuova prassi riguarda i
tempi con i quali si possono sviluppare analisi
di questo tipo. Un astronomo ha tutto il tempo
per analizzare i dati relativi ad un exo-planet.