Freebase e dbpedia

31/03/2007

Le applicazioni del Semantic Web hanno bisogno di dati da elaborare; ecco che nascono Freebase (al momento in alpha privata) e dbpedia.

Freebase by Metaweb

Freebase is an open, shared database of the worlds knowledge.

Freebase.com is home to a global knowledge base: a structured, searchable, writeable and editable database built by a community of contributors, and open to everyone. It could be described as a data commons.

Freebase.com allows anyone to contribute, structure, search, copy and use data, through either the Freebase.com web site or through application program interfaces (APIs). Freebase makes it easy put data in and pull data out for any commercial or non-commercial purpose.

dbpedia

dbpedia.org is a community effort to extract structured information from Wikipedia and to make this information available on the Web. dbpedia allows you to asksophisticated queries against Wikipedia and to link other datasets on the Webto Wikipedia data.

The dbpedia.org project uses the Resource Description Framework (RDF) as a flexible data model for representing extracted information and for publishing it on the Web. We use the SPARQL query language to query this data.


Pensiero fuzzy

25/03/2007

Ripensavo a un post nel quale Federico Fasce scriveva:

Il fatto è che mi sa che ci dovremo abituare presto a uno schema mentale più orientale, se vogliamo capire davvero questa rete liquida, fatta di processi in costante evoluzione e mutamento.

e che avevo così commentato:

Leggendo non ho potuto non pensare alla fuzzy logic. Si dice che la logica fuzzy abbia avuto più ampia diffusione in oriente (più precisamente in Giappone) per via di una maggiore aderenza al modo di pensare orientale.

Potremmo considerare quello di Federico Fasce un invito a “pensare fuzzy”.

Cercando su Google “pensiero fuzzy” mi sono imbattuto in un documento, L’importanza di pensare fuzzy di Donatella Guzzoni, che mi ha indotto ad alcune considerazioni:

non c’è bisogno che un concetto sia preciso affinché abbia significato

ciò vale, come scrivevo, anche per i concetti di web 2.0 e blog.

In molte situazioni la precisione può essere costosa o deviante, o richiedere troppo tempo.

Sollecitato anche dalla tagline di Fuzzzy (il servizio sperimentale di social bookmarking che segnalavo alcuni giorni fa)

with 3 times z because most things are really fuzzzy

riflettevo sul fatto che il tagging è un sistema di classificazione molto più fuzzy di altri. Affiora una domanda: quanto è fuzzy il semantic web?

dobbiamo imparare che non si può rifiutare di riconoscere un calvo se non possiamo contare esattamente, o attraverso una teoria semiprobabilistica agli stati limite, quanti capelli ha perduto: consentiteci l’imprecisione di riconoscere un calvo a vista.

Questo mi ha ricordato i post del prof. Fuggetta relativi alle classifiche dei blog: Correttezza e significatività e Feed Burner e le metriche (dove ci sono anche due miei commenti); parafrasando potremmo dire: “dobbiamo imparare che non si può rifiutare di riconoscere la popolarità del blog di Beppe Grillo se non possiamo contare esattamente, o attraverso una teoria semiprobabilistica agli stati limite, quanti sono i lettori del suo feed: consentiteci l’imprecisione di riconoscerlo, a vista, blog italiano più popolare.”

Quantificare un fenomeno in maniera apparentemente accurata lo fa sembrare esatto e ben compreso, ma spesso la complessità e la precisione sono inversamente proporzionali: infatti quando la complessità di un problema cresce, la possibilità di analizzarlo in termini precisi diminuisce.

Azzardo anche un’interpretazione fuzzy del Latent Semantic Indexing: le dimensioni del sottospazio ottenuto tramite ridimensionamento della matrice termini-documenti altro non sono che insiemi fuzzy che contengono termini e documenti.


Fuzzzy

19/03/2007

Sulla necessità di rendere il tagging più strutturato ed ecologico ho già scritto in passato.

Fuzzzy, è un servizio di social bookmarking web 2.0 che cerca di andare in questa direzione utilizzando le Topic Map. E’ un sistema sperimentale frutto degli studi di Roy Lachica all’Università di Oslo.

It is a revolutionary social bookmarking system. The system is developed as a web2.0 organic ontology collaborative socio-semantic polyscopic web research project at the University of Oslo.

[...]

Why is it different from del.icio.us and other social bookmarking sites?
Fuzzzy is not only social but also semantic which means that the Tags used have more meaning. When bookmarks are assigned a meaning using a standard like the ISO 13250 Topic Map then people as well as other computer systems can make use of the embedded knowledge in a more meaningful way. This way of categorising content is a middle way between the top-down monolithic taxonomy approach like the Yahoo directory and the more recent social tagging (folksonomy) approaches.

Qui delle slide di presentazione con schema dell’architettura del sistema, data model, valutazione dei primi risultati.


Er mejo figo

18/03/2007

E’ stato diggato diversi mesi fa ma io lo scopro solo ora.

:-)

programmer_hierarchy.gif

[ da lukewelling.com ]


Amicizia

15/03/2007

Tutti sono buoni a compatire le sofferenze di un amico, ma ci vuole un’anima veramente bella per godere dei successi di un amico.

Oscar Wilde


Navigare italiano?

11/03/2007

Scrive Marco Camisani Calzolari:

Vorrei lanciare una sorta di campagna di sensibilizzazione per stimolare l’utilizzo di servizi web, siti e prodotti digitali italiani. [ ...] Credo che sia comunque una buona cosa che può far bene all’economia digitale italiana, e quindi a tutti noi, anche quelli che ancora non hanno un’impresa nel web 2.0 e che però troverebbero più spazio in un mercato ricco.

Se il web 2.0 italiano ha bisogno di un appello all’autarchia per poter crescere, di primo acchito mi viene da pensare “Siamo messi male”.

Forse è vero, come più volte ha fatto notare sul suo blog il prof. Fuggetta, che noi italiani spesso sottovalutiamo o ignoriamo prodotti e servizi tecnologici per il solo fatto di essere “made in Italy” mentre siamo pronti a osannarre quelli realizzati oltre confine, quasi non credissimo alla nostra capacità di competere in questo campo.

Se questo atteggiamento è reale, una campagna volta a correggerlo con lo scopo di riportare ad un’obiettività di giudizio, sarebbe la benvenuta; se invece si vogliono spingere i navigatori italiani ad utilizzare prodotti e servizi italiani preferendoli ad analoghi “stranieri” per una mera questione di nazionalità e non di qualità e innovazione, l’appello mi lascia perplesso.

Scrive Matteo Balocco:

Personalmente non userò mai un servizio online italiano finchè esisterà un omologo internazionale che mi consente di avere maggiori potenzialità di distribuzione e dal quale posso recuperare una maggiore quantità di contenuti rilevanti e di mio interesse.

Il suo atteggiamento è anche il mio e credo quello dei navigatori più “sgamati”, che però rappresentano solo una piccola fetta degli utenti internet italiani. E’ ai restanti che si rivolgono molti dei servizi web 2.0 “made in Italy” che infatti si presentano con un’interfaccia esclusivamente in italiano.

Spesso questi servizi sono “cloni” di servizi web internazionali che hanno riscosso successo ma che non hanno ancora una versione localizzata in italiano. La barriera linguistica crea quindi spazio per la realizzazione di servizi simili rivolti esclusivamente a navigatori italiani.

Cosa succederà a questi servizi quando gli omologhi internazionali disporranno di una versione localizzata nella nostra lingua?

Ci sono comunque anche servizi web 2.0 creati da italiani che si rivolgono a un’utenza internazionale.

La lista dei servizi web 2.0 italiani è stata spostata qui.


OpenId

7/03/2007

E’ notizia di ieri che:

You can now use your WordPress.com blog as an OpenID.

Ne approffitto per aggiungere alcuni link che reputo interessanti:

Ovviamente OpenId.net, sito ufficiale con informazioni e specifiche

Descrizione del protocollo OpenId mediante diagramma, facilita la comprensione del funzionamento del protocollo

Sui pro e i conto di OpenID:

Pros and Cons of OpenID

11 Reasons Why OpenID Rocks/Sucks

ongoing – OpenId

Risorse in italiano:

Il blog italiano su OpenId, curato da Claudio Cicali e Michele Campeotto

Altri link:

Simon Willison’s Weblog


Mai dire YouTube …

5/03/2007

per gli appassionati di Lost



Canzoni e canzonette al tempo di Myspace

1/03/2007

E’ tempo di canzoni e canzonette nel paese dei cachi.

Dopodomani, sabato, giornata clou del festival, salirà sul palco dell’Ariston come ospite internazionale un cantante che non ha venduto nel Bel Paese neppure un album (fisico), anche perchè il suo primo album uscirà in Italia solo domani.

Non può che essere un raccomandato.

Infatti, a quanto pare, è “raccomandato da Internet”.

Nell’era del web 2.0 questa è social-discografia.

Intanto il Pippo nazional-popolare ci ricorda che possiamo scaricare le suonerie delle canzoni del festival sui telefonini.

E’ tempo di canzoni e canzonette nel paese dei telefonini.

Nota per Google & C.: qui si parla di Mika e il festival è quello di Sanremo.