Une autre vidéo de Michael Wesh – Information R/evolution

décembre 10, 2007

Après sa vidéo sur le web 2.0 (The machine is us/ing us) , Michael Wesh* propose une nouvelle vidéo sur la façon dont le web révolutionne les modes d’accès à l’info. Plus d’étagères, plus de catégories, finie la hiérarchisation fixe de l’information, place à multi-qualification flexible des données.

 ——————————————————————————

* Michael Wesh est un anthropoloque qui étudie l’impact des nouveaux médias numériques sur la façon dont nous appréhendons l’information.  Il a parallèlement créé un groupe de travail : Digital Ethnography Working Group qui vise à explorer les différents aspects de la médiation de la culture via le numérique. Voir aussi : mediatedcultures.net


Making sense of the semantic web – Nova Spivack

novembre 30, 2007

Potluck

octobre 19, 2007

Dans la série des applications sémantiques du programme Simile (Exhibit, Timeline, Timeplot), voici la dernière petite venue : http://simile.mit.edu/potluck/.

PotLuck permet à n’importe quel utilisateur d’aggréger différentes sources de données puis de les trier, de les filtrer et de les réorganiser comme bon lui semble.  Pour plus d’infos : l’article de David Huynh, le concepteur de l’appli.


HTML, XML, RDF, OWL

août 1, 2007

Chacun de ses langages a été crée pour répondre à différents besoins.

html xml rdf owl

=> aggrandir l’image

HTML permet de créer des pages de contenus multimédias pour le web. Les balises HTML (associées à des propriétés qui peuvent être définies dans des feuilles CSS) sont interprétées par les browsers : elles permettent de définir la présentation de ce contenu et de relier des pages web entre elles.  Elles ne permettent cependant pas de définir quelle est la nature de ces liens, et elles ne permettent pas non plus (si ce n’est au travers de balises meta) de donner des informations explicites sur la nature des informations qui sont diffusées à travers cette page.

Le langage XML permet de structurer des données. Il permet d’articuler des données entre elles suivant une syntaxe qui peut être librement définie au travers d’une DTD ou d’un schéma. Les balises XML permettent ainsi de manipuler les données suivant la façon dont elles ont été structurées.

RDF (Resource Description Framework) est un langage qui permet de décrire des ressources clairement identifiées au travers d’une URI et de rendre explicite la nature des liens entre ces données. Ces relations sont exprimées sous forme de triplets {sujet, prédicat, objet}.

OWL est le langage des ontologies web. Il permet de définir les concepts et les propriétés utilisées pour décrire et représenter un champ d’expertise.

html


Où est la sémantique dans le web sémantique ?

juillet 19, 2007

Résumé de l’article de Michael Uschold « Where are the semantics in the semantic web ? »

  Michael Uschold part du constat qu’il n’y a pas de définition claire de ce qu’est le web sémantique, si ce n’est le but à atteindre : améliorer le traitement des données par les machines en leur donnant accès à la sémantique de ces données. C’est cette notion de « sémantique » que M. Uschold analyse ensuite en définissant un « continuum sémantique » sur lequel se positionnent quatre types de sémantique :

  • sémantique implicite : le sens est tranmis de manière implicite seulement. C’est à partir d’un consensus humain qu’un cadre de compréhension partagé peut ensuite être établi (on avance alors sur le continuum vers la sémantique explicite informelle). Un exemple typique de sémantique implicite est illustré par les tags xml : s’il y a un consensus partagé sur la signification des tags utilisés, il est alors possible de programmer en dur les opérations à effectuer à partir de cette sémantique implicite. Un des problèmes majeurs est alors celui de l’ambiguïté des tags.

  • sémantique explicite et informelle : le sens est explicité au travers d’un document tel qu’un glossaire ou un texte de spécification (exemple : RDF schema, sens des termes du Dublin Core). Un des problèmes posés est qu’à mesure que les implémentations évoluent, ces spécifications peuvent s’avérer partiellement inadéquates.

  • sémantique formelle destinée au traitement humain (cf. logique modale utilisé pour définir la sémantique de termes performatifs)

  • sémantique formelle destinée au traitement informatique : l’idée est ici de permettre aux machines de pouvoir effectuer des inférences à partir du sens des données.

Suite à l’analyse de ce continuum, M. Uschold revient sur le trait caractéristique des applications sémantiques qui est de pouvoir effectuer des traitements en se basant sur le sens des données : la machine doit alors savoir « quoi faire » avec les données qu’elle recontre, mais ceci n’implique pas que la sémantique soit alors explicite ou formelle, puisqu’elle peut aussi être programmée en dur au sein des applications web.  Pour comparer les différentes approches, M. Uschold propose de s’interroger sur les quatre points suivants :

  • Qu’est-ce qui est programmé en dur et qu’est-ce qui ne l’est pas ?

  • Quel niveau d’accord y-a-t-il parmi les différents sites web dans la terminologie utilisée et dans les concepts auxquels une référence est faite ?

  • Dans quelle mesure la sémantique du contenu est clairement spécifiée ? (implicite ou explicite, formelle ou informelle)

  • Les accords sur la sémantique utilisée sont-ils publiquement déclarés ?

Pour conclure, M. Uschold souligne qu’il n’est pas intraséquement meilleur de baser le développement d’une application en se positionnant loin sur  l’axe formel du continuum sémantique : pour de nombreuses applications, il n’est pas nécessaire que les machines aient à déterminer le sens des données utilisées. Plus le niveau d’accord est grand parmi les acteurs, moins il est nécessaire d’avoir une sémantique qui peut-être dynamiquement traitée par les machines.

 


ISTA 2008 – Information System Technology and its Applications

juillet 19, 2007

ISTA 2008 aims at bringing together practitioners, researchers, users,  and  information providers involved in commercial or industrial information  systems to exchange ideas, present their recent research and discuss future  collaboration. We invite submission of papers focusing on technology for subjects like  the following ones:

- the information systems life cycle,
- mobile, pervasive, and ubiquitous information systems,
- components, COTS, and services,
- semantic Web and knowledge intensive systems,
- ontologies,
- e-learning,
- homeland security, and
- natural language processing.

abstract submission : 12 october

paper submission : 1 november


1st ACM International Workshop for Ph.D. Students in Information and

juillet 19, 2007

The goal of the PIKM workshop is to encourage Ph.D. students to present
their dissertation research at a relatively early stage. The targeted
students are those with a focus in any of the CIKM research tracks,
i.e., databases, information retrieval or knowledge management.
Interdisciplinary work across the three tracks is particularly encouraged.

submission deadline : 30 july


Suivre

Recevez les nouvelles publications par mail.