Le
web sémantique c'est une secte ?
Alors c'est quoi le web sémantique ?
A quoi sert le langage RDF et ses triplets ?
Que veut dire ontologie quand ce n'est pas
de la philo ?
Quelles applications pour le web sémantique
?
Pour en savoir plus
Dans
les clubs ou les associations que je fréquente, on ne parle
depuis quelque temps que du « web sémantique
», nouveauté censée révolutionner
le Web.. Je me suis donc inscrite à divers ateliers ou
conférences les plus récents à
Autrans en janvier dernier pour tenter d'y voir
plus clair. Hélas ! Plus j'entendais d'explications, moins
je comprenais quoi que ce soit. Pire, j'avais la désagréable
impression que certains orateurs, soit cultivaient l'ésotérisme à dessein, soit ne maîtrisaient pas du tout leur sujet.
Je ne peux résister au plaisir de vous citer ceci :
| " Le web sémantique [...] possède un caractère sémantique dans la mesure où il s'appuie essentiellement sur la vertu d'objectivation de l'informatique pour valoriser les expressions particulières en les réunissant au-delà de leurs spécificités au sein d'un système d'information unique. Réciproquement, tout message, dans son ambition de participation à la communication planétaire, doit s'alourdir d'une enveloppe abstraite [...], cette abstraction qui n'est qu'humaine pouvant être convertie en principe en potentiel d'universalité et de discrimination par le pouvoir objectivant informatique." |
C'est à hurler de rire, ne dirait-on pas un texte style pipotron, généré par javascript ? Lisez encore ceci : « Le web sémantique est une forme de Graal de la Communication, et je pèse mes mots. » Bon. Ces mots bien pesés, je m'étais persuadée que le Web Sémantique était au mieux une technologie en train de se chercher, et au pire une secte d'allumés, lorsque j'ai croisé Carole et lui ai raconté mes malheurs. Pouvait-elle m'aider ?
Carole, le Web Sémantique, c'est quoi ?
Aujourd'hui, me répond Carole, le contenu du Web est
fait pour des lecteurs humains, mais pas pour des ordinateurs.
Et alors ? C'est grave, docteur ?
Oui, c'est grave pour faire une recherche efficace. Comme
il y a de plus en plus de pages web, des milliards, et que le moteur
de recherche ne comprend pas le sens des documents, sa recherche
sera de moins en moins efficace.
Mais on peut mettre des métatags dans la page pour
aider les moteurs !
Oui, les métatags, [mots-clés
qu'on met en tête de la page HTML, qui ne s'affichent pas
mais sont visibles pour les moteurs de recherche ndlw],
sont certes une petite avancée, mais elle reste très
limitée. L'idée du Web Sémantique c'est
de permettre une recherche intelligente sur le web, faite par des
ordinateurs et basée sur des définitions qu'ils
puissent « comprendre », des définitions
données pour le monde entier.
Quel genre de définitions ? Comme dans un dictionnaire
?
Pas exactement : disons qu'il faut mettre à disposition un langage de recherche, qui complète le web d'aujourd'hui,
et qui rende son contenu intelligible par des applications différentes.
Autrement dit, qui lui donne un sens, c'est la signification
du mot « sémantique ».
Ce langage, c'est XML ?
Non ; XML n'est qu'un langage de description
de document. Il permet de structurer l'information que l'on fait
apparaître. Il consiste en de simple tags qui délimitent
des données. Mais il ne donne pas la signification de ses
structures ! Et sans la définition des structures, seul
celui qui a créé le document est capable de le comprendre.
Alors c'est RDF (Resource Definition Framework) qui
va permettre de définir les structures, et cela au moyen
de propositions ou « triplets » de type sujet/verbe/complément.
Par exemple, une définition du type « une femme
d'oncle est une tante » sera indipensable pour rechercher
dans un arbre généalogique..
RDF est donc un langage ?
Mmoui...si tu veux ; ou plutôt un mode de stockage
des définitions, comparable à une feuille de style
CSS. Mais en beaucoup plus complexe, car basé sur la théorie
des triplets : tout document sera en effet défini par les
occurrences de ces trois données, sujet verbe complément,
ou plus exactement sujet, prédicat, objet encore
appelés objet,attribut,valeur [A(O,V)].
A chaque tag XML correspond un triplet dans RDF. Dans la représentation
graphique de RDF, le sujet et l'objet sont représentés
par des sortes d'ellipses appelée "noeuds", et
le prédicat par une flèche qui va du sujet vers l'objet.
On dirait de l'Intelligence Artificielle appliquée
au web ?
Non, car la grande différence, c'est que l'IA est
basée sur la centralisation des données dans une Base
de Données, alors que dans le Web sémantique, les
données peuvent être n'importe où, l'agent intelligent
va les prendre en se baladant partout, sans qu'on ait besoin de
les stocker.
Comment est-ce possible ?
C'est que je ne t'ai pas encore tout dit ! En plus d'une
structure (XML) et d'un langage définissant cette structure
(RDF), le web sémantique se caractérise par le fait
que chaque
partie du « triplet » RDF possède un identifiant
appelé URI (Uniform Resource Identifier) qui permet
à l'agent de le repérer.
Ca a un rapport avec l'URL ?
Oui l'URL est un cas particulier de l'URI. Les URIs assurent
que les concepts ne sont pas juste des mots dans un document, mais
quils sont attachés à une définition
unique que tout le monde peut trouver sur le web.
En tout cas, cela change tout, car ainsi on pourra vraiment travailler
en grids, en peer to peer, c'est
à dire d'ordinateur à ordinateur, si les définitions
sont partagées par tous. Pour me résumer, dans le
web sémantique on a donc un
support, le XML, qui organise le document, puis le RDF qui définit
la structure c'est-à-dire la signification des tags XML,
et enfin un univers non centralisé, mondial, avec des grids
et du peer to peer.
Et l'ontologie là dedans
c'est quoi ? On en entend souvent parler à propos du web
sémantique, or l'ontologie, c'est l'étude de l'être
en tant qu'être, si je me souviens de mes cours de philo !
Effectivement. Mais dans le cas du Web Sémantique,
ce mot comme pas mal d'autres dont "triplets"
est emprunté au vocabulaire de la logique formelle et
signifie tout à fait autre chose ! Je ne voulais pas t'en
parler pour ne pas trop compliquer les choses, mais puisque c'est
toi qui pose la question... En mathématique informatique,
donc, une ontologie c'est la spécification formelle de la
représentation des concepts, objets et entités et
de leurs relations.
Et ça sert à quoi ?
Une ontologie typique sur le web a une taxonomie et
un répertoire de règles dinférence dans un domaine de connaissances donné. La taxonomie définit
des classes dobjets et leurs relations, exactement comme le
fait par exemple la classification des animaux en embranchements,
classes, ordres, familles, genres, espèces et sous
espèces . Les règles dinférence peuvent
apporter une plus grande visualisation des éléments.
Une ontologie peut exprimer la règle « si un code
département est associé avec un code région
et quune adresse utilise ce code département, alors
cette adresse est associée avec le code région ».
Avec le langage permettant d'écrire les ontologies, OWL (Web
Ontology language), et RDF, des applications vont pouvoir utiliser
et traiter les informations contenues dans des documents, indépendamment
des humains.
Quel genre d'applications
?
Par exemple dans le domaine du commerce électronique.
Imaginons un consommateur qui veut acheter une voiture. Un agent
intelligent va chercher à sa place toutes les voitures correspondant
à ses critères, comparer les prix, vérifier
la disponibilité, les délais de livraison etc. en
fouillant dans les documents du web décrits selon les standards
du web sémantique. Autre exemple, donné par l'inventeur
du web sémantique qui est d'ailleurs le même que celui
du web tout court, à savoir Sir Tim Berners-Lee : je reçois
un appel sur mon téléphone, aussitôt il va transmettre
à tous les appareils possédant un réglage de
volume sonore, hi-fi, télé.. l'ordre de baisser le
son pour que je puisse téléphoner en paix..
Mais cela suppose que les documents en question soient
décrits comme le veut le web sémantique, et c'est
loin d'être le cas !
Pas encore mais ça vient. Le W3C s' occupe de définir
les standards. Il y a toujours un temps d'évangélisation
! Les premières définitions de Tim Berners-Lee concernant
le web sémantique sont sorties en 2001, mais à l'époque
personne n'a compris, c'était trop tôt. Maintenant
il y a déjà des applications qui marchent, les gens
se mettent à faire leurs ontologies dans différents
domaines, et surtout on a compris à quel point une recherche
décentralisée sur le web, et non pas sur le mode client-serveur,
est utile aujourd'hui.
C'est la mort annoncée des moteurs classiques ?
Hé oui.
Elisabeth a interviewé Carole, le 3 mars 2004
LIENS UTILES
Pour
en savoir plus sur le web sémantique:
L'article
de Tim Berners-Lee (en français)
Jdnet
XMLfr.org
Inria
Slides
du W3C
articles
universitaires intéressants
Pour mieux
comprendre le vocabulaire utilisé :
Remarquable
article en anglais
Pour rigoler
un peu du jargon :
http://websemantique.org/ReperePointDepart
http://autrans.crao.net/index.php/AtelierWebS%E9mantique
Pour
connaître ou imaginer des applications :
www.isima.fr/limos/publi/paper/2003/RR0315.doc (article technique)
http://www.servicedoc.info/article.php3?id_article=133 (domaine du droit)
http://jena.hpl.hp.com:3030/blojsom-devt/blog/semantic-web/
etc etc.