Il Tao di Internet

9/03/2006

Da PC Professionale:

Il Tao di Internet dice che quando un problema è comune a tutti, qualcuno nel mondo lo ha già risolto in modo eccellente. Chi ha fiducia nella rete sa che deve solo cercare una soluzione logica, razionale e, molto probabilmente open source.


Iris

7/03/2006

Proseguo nella segnalazione di apllicazioni semantiche che, IMO, vale la pena provare. Oggi è la volta di un semantic desktop open source: Iris.

IRIS is a semantic desktop application framework that enables users to create a “personal map” across their office-related information objects. IRIS includes a machine-learning platform to help automate this process. It provides “dashboard” views, contextual navigation, and relationship-based structure across an extensible suite of office applications, including a calendar, web and file browser, e-mail client, and instant messaging client.


PageRankDinamico

3/03/2006

Alcuni giorni fa avevo iniziato un post che poi ho tenuto in freezer per completarlo e sistemarlo; dopo aver letto questo articolo su Repubblica ho deciso di scongelarlo così com’era, mantenendo inalterato anche il titolo:

Google dopo il lancio di Google Analytics ha acquisito Measure Map, servizio di statistiche per i blog.

Entrambi i servizi al momento sono free sebbene Measure Map sia ancora ad invito (forse anche per evitare improvvisi collassi in seguito ad un eccesso di registrazioni, cosa accaduta al momento del lancio di Google Analytis).

Sono servizi di alta qualità la cui gestione immagino richieda molte risorse, con conseguenti costi non trascurabili. Per quale motivo Google dovrebbe fornirli gratuitamente? Per accapparrarsi utenti e poi proporre loro servizi pro a pagamento?

Forse. A mio parere l’interesse di Google verso i servizi di tracking ha però anche l’obiettivo di raccogliere dati sulla navigazione degli utenti da utilizzare poi per migliorare i propri servizi di ricerca web.

Il successo di Google è dovuto all’utilizzo di un algoritmo che stabilisce per ogni pagina un livello di popolarità, pagerank, che si basa sul numero dei link entranti alla pagina, opportunamente pesati a seconda della popolarità delle pagine linkanti.

Il pagerank di una pagina può essere visto anche come indice della probabilità che un utente raggiunga quella pagina. Tenendo ferma quest’ottica è facile pensare che tale indice può essere raffinato considerando il reale comportamento degli utenti durante la navigazione (quali link l’utente segue, quanto tempo trascorre su una pagina, ecc..), trasformando il “pagerank statico” in un “pagerank dinamico” ossia in un “pagerank a runtime”; in pratica non ci si limita a contare il numero dei link (statico) ma si conta anche quante volte questi vengono effettivamente cliccati (dinamico).

Un pagerank che tenga conto del comportamento dell’utente è in grado di catturare parte delle considerazioni, dei ragionamenti ovvero dell’intelligenza che guida la navigazione di un umano.

Di particolare interesse è l’analisi del comportamento di un utente nell’utilizzo dei motori di ricerca: quali tra i link risultanti da una ricerca per un determinato set di parole chiave decide di visitare, e in quale sequenza, quanto tempo rimane sulle pagine visitate, quali link contenuti nella pagina raggiunta tramite il motore di ricerca decide di seguire, quali pagine decide di inserire nel segnalibri ecc…

Io credo che l’interesse di Google verso i sistemi di tracking sia dovuto alla necessità di raccogliere dati sulla navigazione degli utenti per poter raffinare il pagerank.

L’articolo citato confermerebbe che, se il relerank può essere messo in relazione con il RelevancyRank di Claria, questa è la strada che anche Msn sta percorrendo per migliore il proprio search engine.