Pensiero fuzzy

Ripensavo a un post nel quale Federico Fasce scriveva:

Il fatto è che mi sa che ci dovremo abituare presto a uno schema mentale più orientale, se vogliamo capire davvero questa rete liquida, fatta di processi in costante evoluzione e mutamento.

e che avevo così commentato:

Leggendo non ho potuto non pensare alla fuzzy logic. Si dice che la logica fuzzy abbia avuto più ampia diffusione in oriente (più precisamente in Giappone) per via di una maggiore aderenza al modo di pensare orientale.

Potremmo considerare quello di Federico Fasce un invito a “pensare fuzzy”.

Cercando su Google “pensiero fuzzy” mi sono imbattuto in un documento, L’importanza di pensare fuzzy di Donatella Guzzoni, che mi ha indotto ad alcune considerazioni:

non c’è bisogno che un concetto sia preciso affinché abbia significato

ciò vale, come scrivevo, anche per i concetti di web 2.0 e blog.

In molte situazioni la precisione può essere costosa o deviante, o richiedere troppo tempo.

Sollecitato anche dalla tagline di Fuzzzy (il servizio sperimentale di social bookmarking che segnalavo alcuni giorni fa)

with 3 times z because most things are really fuzzzy

riflettevo sul fatto che il tagging è un sistema di classificazione molto più fuzzy di altri. Affiora una domanda: quanto è fuzzy il semantic web?

dobbiamo imparare che non si può rifiutare di riconoscere un calvo se non possiamo contare esattamente, o attraverso una teoria semiprobabilistica agli stati limite, quanti capelli ha perduto: consentiteci l’imprecisione di riconoscere un calvo a vista.

Questo mi ha ricordato i post del prof. Fuggetta relativi alle classifiche dei blog: Correttezza e significatività e Feed Burner e le metriche (dove ci sono anche due miei commenti); parafrasando potremmo dire: “dobbiamo imparare che non si può rifiutare di riconoscere la popolarità del blog di Beppe Grillo se non possiamo contare esattamente, o attraverso una teoria semiprobabilistica agli stati limite, quanti sono i lettori del suo feed: consentiteci l’imprecisione di riconoscerlo, a vista, blog italiano più popolare.”

Quantificare un fenomeno in maniera apparentemente accurata lo fa sembrare esatto e ben compreso, ma spesso la complessità e la precisione sono inversamente proporzionali: infatti quando la complessità di un problema cresce, la possibilità di analizzarlo in termini precisi diminuisce.

Azzardo anche un’interpretazione fuzzy del Latent Semantic Indexing: le dimensioni del sottospazio ottenuto tramite ridimensionamento della matrice termini-documenti altro non sono che insiemi fuzzy che contengono termini e documenti.

5 Risposte a “Pensiero fuzzy”

  1. Federico Dice:

    Riprendendo la discussione sulle classifiche dei blog mi viene in mente che una possibilità di creare una classificazione attendibile potrebbe venire dalla teoria degli indici – e penso che Fuggetta pensasse a questa metodologia – che consente di creare da un’aggregazione di indicatori eterogenei un valore unico e confrontabile. La procedura consiste di vari passi – analisi multivariata, gestione dati mancanti, normalizzazione, pesatura ed aggregazione – e serve a minimizzare soggettività e margini d’errore.
    In campo ambientale procedure per il calcolo di indici ambientali a partire da indicatori semplici sono descritte in alcuni documenti del JRC (Joint Research Centre della Commissione Europea). Forse si potrebbe adottare (adattare) tale metodologia per le classifiche dei blog (siti, portali).

  2. emmeesse Dice:

    Non sapevo dell’esistenza della “teoria degli indici”; su google ho trovato questa tesi di scienze ambientali dove si parla di teoria degli indici (capitolo 2 e 3). Ora non ho il tempo per approfondirne la lettura ma da una rapida occhiata ho notato che si parla di PCA (Principal Components Analysis) che invece conosco applicata ai testi; non si cita invece ICA (Independent Component Analysis):

    It is a general-purpose statistical technique, which tries to linearly transform the original data into components that are maximally independent from each other in a statistical sense. Unlike LSI, the independent components are not necessarily orthogonal to each other, but are statistically independent. This is a stronger condition than statistical uncorrelateness, as used in PCA or LSI. [ http://users.cs.dal.ca/~shepherd/pubs/siam05.pdf ]

    Due sono le cose che guardando la top 10 di Blogbal appaiono immediatamente ed evidentemente stonate anche agli occhi di uno come me che di statistica non sa molto:
    - il blog di Beppe Grillo è penalizzato di 5 posizioni per la mancanza di un dato (banale considerazione che comunque qualcosa dice: su Bloglines: Grillo 610 sottoscrittori, donwnloadblog 355 sottoscrittori)
    - ci sono sicuramente correlazioni tra i dati di Google, GoogleBlog, Yahoo, Technorati che potrebbero essere analizzate.

    Approfitto per chiarire una cosa: sospendendo le considerazioni sulla significatività della classifica, trovo che, per tutto il resto, Blogbal sia un servizio ben curato. Se consideriamo la classifica come un “gioco”, così com’è ora può anche andare bene; non escludo che la classifica sia stata intelligentemente pensata come attività di marketing, facendo leva sul narcisismo e sulla autoreferenzialità dei blogger :-), al fine di affermare un “brand” per poi lanciare altri servizi per lettori di blog e blogger (vedi ad esempio la funzione di ricerca già implementata). Inoltre dobbiamo considerare i costi (risorse di elaborazione, tempo, ecc..) dell’eventuale implementazione di certe tecniche di analisi dei dati.
    Se si vuole dare significato scientifico alla classifica, beh allora è tutto un altro discorso …

  3. Federico Bo Dice:

    Da quella tesi ho preso in prestito il termine “teoria degli indici”. Fa parte della documentazione consultata per una mio piccolo lavoro per l’APAT sulla rappresentazione grafica degli indicatori ambientali. Se possono interessare i suggerimenti del JRC per la creazione di indici composti sono qui: http://farmweb.jrc.ec.europa.eu/ci/Document/EUR%2021682%20EN.pdf
    Io pensavo ad una metodologia scientifica per la valutazione di blog, siti ed in generale di fonti sul Web. Ad una prima occhiata, considerando il problema attinente all’information retrieval, non c’è molto in Rete.

  4. emmeesse Dice:

    Io pensavo ad una metodologia scientifica per la valutazione di blog, siti ed in generale di fonti sul Web.

    Sul tema mi viene in mente quanto a inizio anno scriveva Giuseppe Granieri su Apogeonline:

    L’anno delle metriche
    [...] Le metriche serviranno a fare in modo che chi ragiona sulla pubblicità abbia sufficienti elementi per valutare l’impatto e il risultato degli investimenti in Rete. Le page views e le metriche attuali (derivate dalla logica televisiva) non rendono sufficiente giustizia alle potenzialità del web e non convincono fino in fondo gli investitori. Le metriche che servono, probabilmente dovranno tenere conto di parametri del tutto nuovi: affidabilità (sui singoli temi, non personale), capacità di influenza, relazioni. Ma anche, in una topologia della conoscenza in cui una pagina è accessibile in maniera proporzionale al numero di link che puntano a essa, di una certa quantità di variabili di cui ad oggi non veniamo ancora a capo. In futuro queste metriche dovranno monitorare e rendere misurabile la Rete non in maniera statica, ma dinamica. Si sta facendo molta ricerca e si coniano ogni giorno nuovi concetti: l’ultimo è lo shifting hub, che rende bene l’idea di come siano necessarie metriche dinamiche.

    Questa delle metriche è la grande scommessa persa da Technorati, che non ha capito bene, a mio modo di vedere, il suo ruolo potenziale nello sviluppo dell’intera Internet. [...]

  5. Federico Bo Dice:

    Pensavo di segnalare questo post sul blog di Bloglabel ma ho visto che lo già hai fatto tu.
    Per essere onesti la metodologia usata per “classificare” i blog mi lascia un po’ perplesso…non mi sembra molto scientifica. Su quali basi si fonda? Solo i link come riferimento? Come sono scelti i pesi? Niente analisi di sensitività?
    ps piacevole Rob Costlow ; molto adatto come sottofondo per le sessioni di programmazione…

Lascia una Risposta