Folksonomies e tagging/3

29/09/2006

Altri link e informazioni

1. Ieri ho scoperto Semanlink; in parte e per certi versi è simile a quello che avevo in mente quando parlavo di RDF(S) e folks ontology:

It is a tagging utility, based on RDF, that can be used to add tags (and other RDF metadata) to files, bookmarks, and to short notes that it allows to write, organize and display.

But Semanlink also provides a simple way to organize your tags in a graph: each tag may have several “parents” and “children”, as well as other RDF properties. Tagging the tags allows you to incrementally define the vocabulary you use to annotate documents. This way, you model your own representation of concepts and their relations. Semanlink provides a GUI to easily navigate through the graph of tags. And of course, the taxonomy you build is used when searching: for instance, a document tagged with “RDF” will be found when searching for “Semantic Web”.

2. Davvero molto interessante questa analisi cognitiva che spiega i processi mentali che guidano il tagging e la categorizazione evidenziando la differenza tra le decisoni di categorizzazione che facciamo quotidianamente e la categorizzazione digitale:

[...] In the digital world, we don’t just categorize an object, we also optimize its future findability. We need to consider not just the most likely category, but also where we are most likely to look for the item at the time of finding. These two questions might lead to conflicting answers, and complicate the categorization process.

Also, with digital objects, it’s not just adhoc categorization – put an object into a category, any category that comes to mind. We need to consider the overall categorical scheme. Is my scheme becoming unbalanced? Do I have too many items in one category, and too few in another? If I put everything in one category, I will never be able to find anything.

[...] Start thinking of all this and you land into “post activation analysis paralysis”. A state of fear that you will make the wrong decision. And the item will be lost forever – it will land in some deep well, some hard to access branch of the tree and disappear from your view and attention.

[...] why is tagging simpler. In my opinion, tagging eliminates the decision – (choosing the right category), and takes away the analysis-paralysis stage for most people. (Note that some people might still freeze up in deciding between different tags, or figuring out ways to optimize future findability. These are valid concerns that tagging systems can address better than they do now).

Vedi anche:

Folksonomies e tagging/1

Folksonomies e tagging/2


Folksonomies e tagging/2

27/09/2006

Proseguo il discorso iniziato alcuni giorni fa aggiungendo altre informazioni e link.

1. Ringrazio Federico Bo per aver segnalato il progetto “TAGora: Semiotic Dynamics in Online Social Communities”. Dal comunicato stampa di presentazione:

“TAGora”, interamente concepito ed ideato in Italia da fisici CNR-INFM e studiosi dell’Università di Roma “La Sapienza” impegnati nello studio di sistemi complessi, mira proprio alla comprensione e al controllo di questi nuovi scenari (online social communities, tagging, folksonomy, … n.d.r.) mediante accurate analisi statistiche di dati sul web, nuovi esperimenti ed applicazioni e modellizzazioni teoriche, in un circolo virtuoso che si avvale della collaborazione di scienziati di fama mondiale nel campo della Fisica, della Computer Science e della Linguistica.
Finanziato dall’Unione Europea per tre anni, TAGora vede coinvolti anche prestigiosi gruppi internazionali quali il team francese del Sony Computer Science Laboratory a Parigi, due gruppi di ricerca tedeschi, rispettivamente l’Institute for Computer Science dell’Università di Koblenz-Landau e il Knowledge and Data Engineering unit del Dipartimento di Mathematics and Computer Science dell’Università di Kassel, ed il team inglese della School of Electronics and Computer Science dell’Università di Southampton.

Il progetto si avvale anche di un blog.

2. A commento di un post di Federio Bo su TAGora, arancina scrive:

Viviamo in un universo di codici, ciò che conosciamo necessariamente trova un suo nome, una sua classificazione, un suo “tag”… ed è grazie a questo “tag” che ogni cosa prende vita, per lo meno per noi. Ciò che non ha nome, l’indicibile, l’inafferrabile, l’intraducibile, l’inclassificabile, non ha luogo, nè vita nel nostro universo cognitivo. Ma la speranza, la voglia di scoprire un universo più grande sovrasta il nostro essere “finiti”. La scoperta dell’infinito non smette e non smetterà di affascinarci. La voglia di “andare oltre” ci tormenta. E questa, per me, è poesia!

3. Facetag verrà presentato il 30 settembre all’Euro IA 2006; immagino quindi che nei prossimi giorni sapremo qualcosa di più su questo progetto.

Vedi anche:

Folksonomies e tagging/1

Folksonomies e tagging/3


Wikio.it

26/09/2006

Con piacere segnalo l’avvio della versione italiana di Wikio alla quale sta lavorando anche il già citato Lorenzo Viscanti.

Dal blog italiano di Wikio:

Wikio é un motore di ricerca di attualità, che unisce i media tradizionali, i “blog” e le pubblicazione degli utenti.
L’idea é di dare una visione completa su tutto quello che giornalisti o semplici appassionati hanno scritto su un argomento.
Qui non si tratta più di una lettura passiva delle news, ma invece di una participazione attiva, votando per gli articoli di qualità, gli argomenti più importanti, facendo in questo modo una scelta editoriale collettiva.

Notevole la navigazione per tag.

Via motoricerca.net


Non lo sapevo

23/09/2006

Non ci sono più le cassiere di una volta.

Ora ci sono le hostess di cassa.

Da Miss Italia 2006 – RaiUno:  “ Numero 48. Isabella, 23 anni. Hostess di cassa.”


Folksonomies e tagging/1

21/09/2006

Laura Parigi sostiene che “il problema delle folksonomies è un serio problema linguistico in mano a degli smanettoni e a dei piazzisti di servizi web. Ci vuole rigore.”

Focalizzando l’attenzione ai sistemi di tagging/folksonomy, penso che se questo problema linguistico è in mano a smanettoni e piazzisti del web è solo perchè chi dovrebbe occuparsene con rigore non è in grado oggi di proporre e implementare sistemi di classificazione e ricerca più efficaci e usabili del tagging/folksonomy.

Il tagging/folksonomy sarà pure un sistema rozzo ma risulta semplice e in molti casi (ad esempio gestione dei bookmark o delle immagini) efficace e utile; da questo deriva il successo di del.icio.us.

Credo altresì sia comune a molti di coloro che usano servizi di tagging l’esigenza di qualcosa di più strutturato, più ecologico.

Alcuni giorni fa mi sono imbattuto nel blog di Nicola Mattina che propone di “affiancare” ai tag un thesaurus; nel commentare scrivevo che da diverso tempo mi frulla nella testa l’idea di dare ai tag un valore semantico usando RDF(S), creando delle folks ontologies (folksologies o folkontologies); il problema è rendere l’uso del sistema semplice per l’utente finale (altrimenti torniamo al discorso fatto sopra).

In tema di folksonomy e tagging molto interessanti sono i post di Emanuele Quintarelli, in particolare questo, Folksonomies 2.0 – The Chaotic Order:

I love tags. I really love, as an user, having a way to add a simple powerful metadata layer to my data without having to adopt a centralized hierarchical schema proposed by someone else.

But tags, as we now experience them, don’t satisfy me! They are messy and their widespread adoption is making them also more messy.

Sottoscrivo. Molto interessante il resto del post, da leggere!

Emanuele Quintarelli, insieme a Luca Rosati e Andrea Resmini, sta lavorando a FaceTag (qui un post di introduzione):

What: FaceTag is a working prototype of a semantic collaborative tagging tool conceived for bookmarking information architecture resources. It aims to show how the flat keywords space of tags can be effectively mixed with a richer faceted classification scheme to improve the system information architecture.

Why: Facets constitute an adaptive classification system capable to represent both a knowledge in movement (like that of collaborative environments) and several mental models at the same time. The blend of tags and facets is able to empower the information scent and berrypicking capability of the system.

Vedi anche:

Folksonomies e tagging/2

Folksonomies e tagging/3


Dapper, screen scraper per creare API per qualsiasi sito

15/09/2006

Dapper è un servizio web (classificabile come web 2.0) che permette, mediante screen scraping, di creare API per qualsiasi sito. Dapper consente in modo estremamente semplice di estrarre dati da un qualsiasi sito web (ciò naturalmente potrebbe creare problemi di copyright) rendendoli disponibili in vari formati (XML, RSS, etc. ) per ulteriori elaborazioni.

E’ disponibile uno screencast che mostra Dapper in azione.

Dapper è simile a Solvent l’estenzione di Firefox, realizzata nell’ambito del progetto Simile, che consente mediante screen scraping di estrarre dati in formato RDF da utilizzare poi con PiggyBank.


Non solo Google

14/09/2006

Non esistono solo Google, Yahoo, Live (Microsoft) e Ask; ci sono altri motori (alcuni ancora in fase alpha o beta) che adottano nuove tecnologie o che propongono diverse modalità di ricerca e di visualizzazione dei risultati.

Clusty – (Info)

Clusty queries several top search engines, combines the results, and generates an ordered list based on comparative ranking.

Instead of delivering millions of search results in one long list, our search engine groups similar results together into clusters. Clusters help you see your search results by topic so you can hone in on exactly what you’re looking for or discover unexpected relationships between items.

Hakia – (Info)

built a much better system (called MAQ) to enable semantic analysis of Web pages, and “meaning-based” search. The information density in the MAQ system is significantly higher than that of a typical index table.

hakia’s proprietary method, which deploys full Ontological Semantics, gives the search engine human-like abilities to understand natural languages and detect meaning in text.

hakia deploys fuzzy logic (approximate reasoning) methods to allow flexibility so that the Ontological Semantics solution becomes feasible in a Web search application with stringent constraints.

hakia’s knowledge capacity evolves in time with each user interaction and by crawling over the Web. The intensity of Web page analyses increases each time a particular topic is questioned.

Lexxe – (Info)

Based on the nature of the queries, there are two types of search conducted by users. One is the key word-based search and the other is the Natural Language-based search. Lexxe allows both types of searches and applies cutting edge Natural Language technologies to them.

On the one hand, Natural Language queries offer a better information quality and intention by a user. Therefore, it can be used to retrieve better results, particularly short answers, because key words are often more ambiguous than Natural Language queries.

Brainboost – (Info)

Brainboost actually finds answers to your questions posed in plain English as opposed to directing you to pages that simply mention the questions.

Brainboost, Using the AnswerRank™ system, intelligently reads hundreds of web pages derived from search results and extracts just the short and concise answer to your question, saving you time.

Accona – (Info)

In una richiesta di cinque parole chiave l’intelligenza artificiale di Accoona consente all’utente di evidenziare una parola chiave e ordina i risultati della ricerca dando priorità alle pagine nelle quali il significato di quella parola chiave è più importante delle altre quattro. Inoltre, l’intelligenza artificiale di Accoona fonde le informazioni del Web con quelle del database delle imprese di Accoona in tempo reale. Ad esempio quando si è on line e si cerca di comprare un nuovo computer, si ottiene immediatamente una lista di tutti gli indirizzi URL di rivenditori di computer.

Rollyo – (Info)

Rollyo puts the power of search in your hands, by giving you the tools to create your own personal search engines – with no programming required. All you have to do is pick the sites you want to search, and we’ll create a custom search engine for you.

You can explore and save searchrolls created by the community of Rollyo users and share your knowledge on a particular set of topics. You can even edit Searchrolls created by others.

Swicki – (Info)

A swicki is new kind of search engine that allows anyone to create deep, focused searches on topics you care about. Unlike other search engines, you and your community have total control over the results and it uses the wisdom of crowds to improve search results. This search engine, or swicki, can be published on your site. Your swicki presents search results that you’re interested in, pulls in new relevant information as it is indexed, and organizes everything for you in a neat little customizable widget you can put on your web site or blog, complete with its very own buzz cloud that constantly updates to show you what are hot search terms in your community.

Kartoo – (Info)

Kartoo è un metamotore di ricerca che presenta i risultati sotto forma di mappe.

Snap – (Info)

Fast Visual Display of Results Previews

Se conoscete altri motori di ricerca che ritenete possano essere inseriti in questa lista, segnalateli mediante commenti.

Vedi anche: Powerset


Binario

14/09/2006

Al mondo esistono 10 tipi di persone: quelle che conoscono il codice binario, e quelle che non lo conoscono.


Integrazione di ontologie

14/09/2006

Interessante post di Nova Spivack sul problema dell’integrazione (importazione/mapping) delle ontologie:

Unless mappings are created between them (ontologies), instead of a Semantic Web, we’ll just have millions of little semantic silos. Maybe some company will succed in making the biggest silo and that will be “the” semantic web to most people. That might be the best solution in fact, but I’m not sure that is really what Tim Berners-Lee had in mind!

So in conclusion, I think that the most critical missing piece of the semantic web puzzle is a good tool – and a good methodology – for mapping between ontologies. The reason I think a mapping tool is a critical need is that I think while in theory it’s a nice idea to imagine ontologists reusing ontologies from one another, in practice many ontologists (especially those working on large complex ontologies) would rather write their own internally consistent ontologies and map them to other ontologies rather than importing other ontologies into what they are making and then having to deal with all the inconsistencies and confusion that arises from doing that.


Introduction to Information Retrieval

6/09/2006

E’ disponibile per il download la bozza di un libro di indroduzione all’Information Retrieval. Il libro nasce dai corsi che i tre autori, Christopher D. Manning, Prabhakar Raghavan e Hinrich Schütze, hanno tenuto alla Stanford University.

Sullo stesso sito un elenco di risorse sull’Information Retrieval.