La recherche sur le web, sous toutes ses formes, est la clé de l’accès à l’information aujourd’hui. Au-delà des simples mots-clés habituels, c'est désormais la sémantique qui représente l'avenir.
Les antipodes du naturel en informatiqueLa sémantique renvoie au sens des mots. Lorsqu’elle est appliquée, en théorie du moins, à un moteur de recherche, celui-ci est alors capable de comprendre où l’utilisateur souhaite en venir. Les mots appartiennent à des familles et peuvent être regroupés selon de nombreux critères. Si le moteur de recherche peut comprendre ces critères et procéder à des regroupements, les résultats offerts gagneront largement en précision, sans même parler de la possibilité d’utiliser le langage naturel.
Les antipodes du naturel en informatiqueEvidemment, la sémantique est techniquement un véritable défi. Satya Nadella, vice-président de la recherche chez Microsoft,
résume la situation : «
Les moteurs de recherche sont incapables aujourd'hui de comprendre que le mots arbuste et arbre renvoient à un même concept. On ne comprend pas pourquoi la requête sur le mot cancer renvoie tantôt à l'horoscope, tantôt à la maladie, et comment une recherche ou une page web font référence à l'un ou à l'autre ». Selon Satya Nadella toujours, «
un tiers des recherches n'obtiennent pas de réponse adéquate lors de la première recherche et au premier clic ». Une part très importante qu’il faut donc baisser.
L'arrivée de Powerset chez Microsoft...Intégrer la sémantique dans les capacités d’un moteur de recherche demande à la fois des développeurs et donc un niveau technique important, mais également des spécialistes de la linguistique capables de tracer la voie à suivre. On sait que Microsoft, lorsque le besoin de s’étendre dans un domaine se fait sentir, a souvent tendance à racheter une société pour se lancer. Aujourd’hui encore, c’est le cas, avec la confirmation du rachat de la société Powerset, spécialisée justement dans la sémantique appliquée aux recherches sur Internet.
Comme le montre la capture, Powerset affiche des résultats qui présentent des caractéristiques intéressantes :
- Chaque lien de résultat offre un condensé des informations qu’on peut trouver sur chaque résultat
- Selon
la question, les réponses sont agrémentées d’informations trouvées sur
Wikipedia, en rapport direct avec le sujet principal
- Quand cela est possible, les résultats sont accompagnés de médias complémentaires. Une recherche sur les batiments conçus par Jean Nouvel par exemple.
Certes la somme n’est pas connue, Microsoft n’ayant pas souhaité communiquer sur le sujet pour le moment, mais on sait par exemple que l’entreprise continuera de fonctionner en l’état. Ses locaux resteront les mêmes, à San Francisco. De même, les employés resteront en place.
Il y aura bien sûr un temps nécessaire à l’incorporation du travail
réalisé par Powerset dans les produits concernés chez Microsoft, et en
tout premier Live Search. Les deux buts principaux pour l’éditeur de
Redmond sont d’augmenter de manière drastique la précision des
résultats et la prise en charge du langage naturel, pour poser de
véritables questions ou exposer un problème en une phrase simple.