Après sa vidéo sur le web 2.0 (The machine is us/ing us) , Michael Wesh* propose une nouvelle vidéo sur la façon dont le web révolutionne les modes d’accès à l’info. Plus d’étagères, plus de catégories, finie la hiérarchisation fixe de l’information, place à multi-qualification flexible des données.
——————————————————————————
* Michael Wesh est un anthropoloque qui étudie l’impact des nouveaux médias numériques sur la façon dont nous appréhendons l’information. Il a parallèlement créé un groupe de travail : Digital Ethnography Working Group qui vise à explorer les différents aspects de la médiation de la culture via le numérique. Voir aussi : mediatedcultures.net
PotLuck permet à n’importe quel utilisateur d’aggréger différentes sources de données puis de les trier, de les filtrer et de les réorganiser comme bon lui semble. Pour plus d’infos : l’article de David Huynh, le concepteur de l’appli.
HTML permet de créer des pages de contenus multimédias pour le web. Les balises HTML (associées à des propriétés qui peuvent être définies dans des feuilles CSS) sont interprétées par les browsers : elles permettent de définir la présentation de ce contenu et de relier des pages web entre elles. Elles ne permettent cependant pas de définir quelle est la nature de ces liens, et elles ne permettent pas non plus (si ce n’est au travers de balises meta) de donner des informations explicites sur la nature des informations qui sont diffusées à travers cette page.
Le langage XML permet de structurer des données. Il permet d’articuler des données entre elles suivant une syntaxe qui peut être librement définie au travers d’une DTD ou d’un schéma. Les balises XML permettent ainsi de manipuler les données suivant la façon dont elles ont été structurées.
RDF (Resource Description Framework) est un langage qui permet de décrire des ressources clairement identifiées au travers d’une URI et de rendre explicite la nature des liens entre ces données. Ces relations sont exprimées sous forme de triplets {sujet, prédicat, objet}.
OWL est le langage des ontologies web. Il permet de définir les concepts et les propriétés utilisées pour décrire et représenter un champ d’expertise.
Michael Uschold part du constat qu’il n’y a pas de définition claire de ce qu’est le web sémantique, si ce n’est le but à atteindre : améliorer le traitement des données par les machines en leur donnant accès à la sémantique de ces données. C’est cette notion de « sémantique » que M. Uschold analyse ensuite en définissant un « continuum sémantique » sur lequel se positionnent quatre types de sémantique :
sémantique implicite : le sens est tranmis de manière implicite seulement. C’est à partir d’un consensus humain qu’un cadre de compréhension partagé peut ensuite être établi (on avance alors sur le continuum vers la sémantique explicite informelle). Un exemple typique de sémantique implicite est illustré par les tags xml : s’il y a un consensus partagé sur la signification des tags utilisés, il est alors possible de programmer en dur les opérations à effectuer à partir de cette sémantique implicite. Un des problèmes majeurs est alors celui de l’ambiguïté des tags.
sémantique explicite et informelle : le sens est explicité au travers d’un document tel qu’un glossaire ou un texte de spécification (exemple : RDF schema, sens des termes du Dublin Core). Un des problèmes posés est qu’à mesure que les implémentations évoluent, ces spécifications peuvent s’avérer partiellement inadéquates.
sémantique formelle destinée au traitement humain (cf. logique modale utilisé pour définir la sémantique de termes performatifs)
sémantique formelle destinée au traitement informatique : l’idée est ici de permettre aux machines de pouvoir effectuer des inférences à partir du sens des données.
Suite à l’analyse de ce continuum, M. Uschold revient sur le trait caractéristique des applications sémantiques qui est de pouvoir effectuer des traitements en se basant sur le sens des données : la machine doit alors savoir « quoi faire » avec les données qu’elle recontre, mais ceci n’implique pas que la sémantique soit alors explicite ou formelle, puisqu’elle peut aussi être programmée en dur au sein des applications web. Pour comparer les différentes approches, M. Uschold propose de s’interroger sur les quatre points suivants :
Qu’est-ce qui est programmé en dur et qu’est-ce qui ne l’est pas ?
Quel niveau d’accord y-a-t-il parmi les différents sites web dans la terminologie utilisée et dans les concepts auxquels une référence est faite ?
Dans quelle mesure la sémantique du contenu est clairement spécifiée ? (implicite ou explicite, formelle ou informelle)
Les accords sur la sémantique utilisée sont-ils publiquement déclarés ?
Pour conclure, M. Uschold souligne qu’il n’est pas intraséquement meilleur de baser le développement d’une application en se positionnant loin sur l’axe formel du continuum sémantique : pour de nombreuses applications, il n’est pas nécessaire que les machines aient à déterminer le sens des données utilisées. Plus le niveau d’accord est grand parmi les acteurs, moins il est nécessaire d’avoir une sémantique qui peut-être dynamiquement traitée par les machines.
ISTA 2008 aims at bringing together practitioners, researchers, users, and information providers involved in commercial or industrial information systems to exchange ideas, present their recent research and discuss future collaboration. We invite submission of papers focusing on technology for subjects like the following ones:
- the information systems life cycle,
- mobile, pervasive, and ubiquitous information systems,
- components, COTS, and services,
- semantic Web and knowledge intensive systems,
- ontologies,
- e-learning,
- homeland security, and
- natural language processing.
The goal of the PIKM workshop is to encourage Ph.D. students to present
their dissertation research at a relatively early stage. The targeted
students are those with a focus in any of the CIKM research tracks,
i.e., databases, information retrieval or knowledge management.
Interdisciplinary work across the three tracks is particularly encouraged.
“The 9th International Conference on Information Integration and Web-based Applications & Services (iiWAS2007) is a leading international conference for researchers and industry practitioners to share their new ideas, original research results and practical development experiences from all information integration and web-based applications & services related areas.”
“The purpose of the 4th International Conference on Web Information Systems and Technologies (WEBIST) is to bring together researchers, engineers and practitioners interested in the technological advances and business applications of web-based information systems. The conference has four main track, covering different aspects of Web Information Systems, including Internet Technology, Web Interfaces and Applications, Society, e-Communities, e-Business and, last but not least, e-Learning. “
“IUI 2008 is the annual meeting of the intelligent interfaces community and serves as the principal international forum for reporting outstanding research and development on intelligent user interfaces.”