omme nous l'avons vu dans la première partie, une requête peut être formulée de différentes manières, c'est à dire par mots clés, dans la langue naturelle, mais aussi en utilisant des opérateurs booléens.
Mais tous les moteurs de recherche ne proposent pas les mêmes moyens de requête. Il en va de même pour le classement des résultats, le choix des langues et bien d'autres points.
C'est pourquoi, à travers le tableau présenté en annexes, nous essaierons d'étudier les différentes caractéristiques de quelques uns des principaux moteurs de recherche. Certaines d'entre elles seront détaillées.
Ainsi, les principaux moteurs de recherche utilisent un opérateur booléen par défaut qui sera utilisé s'il n'est pas précisé par l'utilisateur.
Certains moteurs utilisent la troncature, c'est à dire qu'ils coupent le mot à la racine et recherchent avec celle-ci. Pour certains, cette tâche incombe à l'utilisateur.
Mais la recherche peut aussi être faite avec des lettres majuscules, c'est à dire que si l'utilisateur met des lettres majuscules, certains moteurs rechercheront, s'ils disposent de ce module, uniquement les noms propres. Il en va de même pour l'utilisation des accents. Les moteurs restreignent la recherche aux langues possédant les accents, mais attention, les pages en français (par exemple) ne seront pas forcément avec les accents (cela dépend du créateur de la page).
Par ailleurs, l'utilisateur a la possibilité d'inclure ou d'exclure des mots des résultats de la recherche en mettant devant le symbole + ou -. Ces symboles sont associés respectivement aux opérateurs booléens AND et NOT.
De même, l'utilisateur peut choisir, pour certains moteurs de recherche, de voir apparaître, dans les résultats, des mots de la requête à une certaine distance les uns des autres grâce à un opérateur de proximité.
La recherche peut aussi être limitée par rapport à la date en indiquant la période que l'on souhaite voir apparaître dans les réponses.
Quand les moteurs restituent à l'utilisateur les documents correspondant à sa requête, certains d'entre eux peuvent y figurer plusieurs fois. C'est pourquoi, si le moteur possède un module pour le détecter, il ne renverra le document en réponse qu'une seule fois. Sinon, le document sera présent deux fois dans les réponses, voire plus.
Si les résultats de la recherche ne paraissent pas assez précis à l'utilisateur, celui-ci a la possibilité, avec certains moteurs, d'affiner sa requête. Ceci signifie que l'utilisateur peut dans certains cas redéfinir sa première requête en cochant certains mots que le moteur lui propose, ou en exprimant sa requête dans le langage naturel le plus précisément possible.
En ce qui concerne l'affichage des résultats, le volume d'informations trouvées étant important, il devient impératif de classer les documents en fonction de leur pertinence et de retourner les éléments clés des documents.
C'est pourquoi nous allons vous présenter différents moteurs et leur mode d'affichage :
Altavista Il ne s'étend pas sur la pertinence et se contente d'indiquer que les documents les plus pertinents, c'est à dire ceux satisfaisant le mieux la requête, sont affichés en premier.
Il indique ainsi le nombre d'occurrences pour chacun des mots de la requête, ainsi que le nombre de documents la satisfaisant. Ces documents sont ensuite présentés de la manière suivante : leur titre, puis les premières lignes de leur contenu, leur lien URL en clair suivi de leur taille et de leur date de présentation sur le site.
Lycos Il indique le score obtenu, la présence respective des mots employés, ainsi que le taux de mots adjacents rencontré. Il indique, ensuite, le nombre de documents retenus en fonction du score obtenu, le nombre de termes dont la racine est commune aux mots employés, le nombre d'occurrences pour chacun des mots.
Mais l'interprétation à donner au score obtenu demeure floue, aucun indice précis étant fourni à ce sujet. Il en va de même pour les mots générés via la troncature : c'est uniquement en parcourant les documents référencés que ces mots apparaissent.
Cependant, au niveau des documents référencés, la description est abondante. Ainsi, Lycos nous fournit le titre du document, son profil, son résumé, ainsi que son lien URL et sa taille. Sa date de production n'est toutefois pas présente.
OpenText Il se contente d'indiquer le score obtenu, cette donnée permettant de conclure que les documents satisfaisant le mieux la requête sont affichés en premier. Toutefois, au niveau de la description des documents référencés, il se démarque d'Altavista et de Lycos avec l'enchaînement possible à partir de chaque document référencé. Ainsi, en plus de donner accès à la page, il permet de relancer la recherche à partir d'un document en particulier. Parmi les éléments propres au document, on retrouve son titre, sa taille, son lien URL et les premières lignes de celui-ci.
Euroferret Il affiche le titre du document, son auteur, sa date, son lien URL, ainsi que la proximité du document par rapport à la requête.
Hot Bot Il se démarque un peu de ses concurrents puisqu'il laisse le choix à l'utilisateur pour certains points de l'affichage des résultats. Ainsi, en plus du titre du document, de son sujet, de son lien URL, de sa date et de sa pertinence par rapport à la requête, il lui permet de choisir entre une description brève du document, une description complète ou juste les liens URL.
Infoseek Il se rapproche de ses concurrents en affichant le titre du document, ses premières lignes, son lien URL, sa date, ainsi que sa pertinence par rapport à la requête. Mais sa caractéristique est qu'il regroupe les résultats par site.
Excite Il se contente simplement d'afficher le titre du document, son résumé, son lien URL, ainsi que sa pertinence par rapport à la requête.
Webcrawler Il est le moins bavard de tous les moteurs de recherche en ce qui concerne l'affichage des résultats puisqu'il se contente d'afficher le titre du document ou son résumé, ainsi que sa pertinence par rapport à la requête.
Pif (petit moteur expérimental d'un laboratoire de recherche)
Il affiche la requête initiale, la requête reformulée, le nombre de documents trouvés puis il les liste avec leurs poids. On s'aperçoit donc qu'un bref résumé du document ainsi que sa date ne sont pas présentés.
On peut donc constater que, malgré des différences, les similitudes sont aussi intéressantes. Ainsi, d'un moteur à l'autre, on retrouve certains éléments comme le titre du document, le contexte, le lien URL et la taille du document.
Tous les documents retrouvés peuvent être dans une langue que l'utilisateur aura choisie avant de lancer la recherche, puisque tous ces moteurs proposent aux utilisateurs un éventail de langues important.
En ce qui concerne les algorithmes, qui permettent de retourner en premier les documents les plus près de la requête, ils sont suffisamment efficaces pour que l'utilisateur trouve les réponses attendues dès les premières pages. Mais ceux-ci ne sont pas révélés, la discrétion allant de soi !
Après avoir effectué l'étude comparative de quelques moteurs booléens, nous en ferons une analyse approfondie afin de pouvoir définir exactement ce que l'on appelle un bon résultat et un bon moteur de recherche.