Formulation des requêtes

 

Beaucoup de débutants commencent à chercher avec Yahoo, qui reste très connu malgré l'émergence d'autres outils sans doute plus performants. Pourtant les démarches sont souvent inappropriées par rapport à la logique de cet instrument. On a tendance en effet à immédiatement taper un mot-clé dans le champ de recherche, au lieu de profiter de l'énorme travail effectué par les documentalistes de cet annuaire, qui consiste à préparer pour les usagers des cheminements rationnels vers leur cible.

 

Vous utiliserez Yahoo —ou tout autre outil de type annuaire— quand vous aurez clairement identifié par avance où vous situez votre cible. Cela implique chez l'usager certaines connaissances, une culture minimale. Par exemple, la Joconde pourrait être trouvée de deux façons différentes. Si l'on sait qu'elle a été peinte par Léonard de Vinci, on la trouvera sans doute dans la rubrique "Art et Culture", puis dans "Artistes", puis "Maîtres", puis "Peintres", etc.

Si vous savez qu'elle est exposée au Louvre à Paris,  vous la trouverez sans doute plus directement sous "Art et Culture", puis "Musées", puis "Le Louvre". Bien des chemins culturels mènent à elle, mais à l'évidence tous nos jeunes apprenants n'ont pas nécessairement cette compétence.

En d'autres termes, avant de conduire une recherche de ce type, il faudrait systématiquement faire un remue-méninges sur le domaine ciblé afin d'anticiper les chemins offerts par l'outil. Une fois atteinte la branche ultime dans laquelle vous pensez trouver votre ressource, vous pouvez utiliser le moteur de recherche interne de Yahoo, en spécifiant "cette catégorie."

 

La démarche est ici totalement différente. Faisons ensemble quelques erreurs préliminaires :

Exemple 1 : rechercher une biographie de Baudelaire

Beaucoup se diront, je vais taper "biographie de Baudelaire" et ça va marcher. Ce n'est pas si simple. D'abord parce qu'une page biographique sur ce poète ne contiendra pas nécessairement ces mots-clés. 

baudelaire

70,000 documents

Mais si vous tapez baudelaire, vous obtiendrez un nombre incroyable de résultats, parce que de très nombreuses pages ont des chances de contenir ce mot, y compris  des sites personnels, réalisés par des gens qui portent ce nom. (notez que les moteurs ne sont pas sensibles à la casse, il vaut mieux même ne pas du tout mettre de majuscules à vos mots-clés).

charles baudelaire n'est guère plus performant, parce que :

charles baudelaire

documents contenant le mot "charles"
documents contenant le mot "baudelaire"

Mettre les deux mots entre guillemets est une bien meilleure démarche, oarce que la recherche ciblera les pages qui contiennent cette chaîne de caractères, y compris l'espace au milieu.

"charles baudelaire"

seulement les documents contenant "charles baudelaire"

Mais la meilleure approche est d'imaginer quels mots risquent de se trouver dans la page ciblée. Dans une biographie, presque inévitablement vous trouverez, en français, l'expression "né le", dans la même page que le nom du personnage que vous recherchez. D'où l'équation de recherche :

"charles baudelaire" + "né le"

documents contenant une biographie de "charles baudelaire" en français

"charles baudelaire" + born

les mêmes, en anglais

Pourquoi le signe + ? Parce qu'il est reconnu par la plupart des outils de recherche.

Pourquoi pas de guillemets autour du mot born ? Parce qu'il n'y a qu'un seul mot. Les guillemets ne sont nécessaires que pour trouver des instances de plusieurs mots assemblés en une chaîne spécifique de caractères.

Attention, l'usage du français (dès qu'il y a des accents, cédilles ou autres caractères spécifiques) dans une équation de recherche n'est pas innocent. Certes, vous atteindrez ainsi des sites francophones, mais la quantité de ressources disponibles en français, par rapport à l'anglais, est de l'ordre de 1 à 1000.

Exemple 2 : rechercher des ressources sur le clonage

Il y a quelques années avec une classe nous cherchions des ressources en anglais sur le problème éthique du clonage (c'était au moment de la fameuse affaire de Dolly, la brebis clonée). A la suggestion de mes élèves (je jouais le rôle de secrétaire pour qu'ils découvrent d'eux-mêmes, par erreurs successives, les démarches appropriées) j'ai tapé le mot cloning comme requête. Les résultats étaient bizarres, beaucoup d'entrées étant manifestement liées à l'informatique.

cloning computer technology (???)
biology

Mais cela n'aurait pas dû nous surprendre, car les ordinateurs de type PC, les plus courants, ont longtemps été appelés des clones IBM. Aussi avons-nous éliminé le "bruit", comme disent les documentalistes à propos de l'information non pertinente. Il nous fallait cibler les pages contenant à la fois les mots cloning, biology et genetics, et exclure celles qui contenaient comput (ce qui éliminait computER, computE, computING, etc.)

Voici comment les opérateurs logiques permettent de traduire une telle requête à un moteur :

cloning + biology + genetics - comput

Dans la section Recherche Avancée du moteur Voila, c'est ainsi que s'organise la requête :
On place dans le premier champ,
doit contenir, les trois clés cloning biology genetics séparés par des espaces, on clique sur le bouton "tous les mots". Puis on tape comput dans le second champ, ne doit pas contenir.

 

exemple 3 : rechercher des ressources sur l'assassinat de Kennedy

Si vous tapez kennedy assassination dans le champ requête, tout dépend de la manière dont vous paramétrez le moteur à l'aide des trois boutons any, (l'un ou l'autre des mots entrés sera présent dans le document) all (tous) ou phrase (la chaîne de caractères composée des deux mots séparés par un espace), comme ci-dessous.

 

exemple 4: utiliser les suggestions du moteur pour affiner la requête

Ici la requête est trop vague. Metacrawler vous propose les requêtes statistiquement les plus fréquentes qui lui sont soumises et ayant pour base votre mot-clé. Vous cliquez sur la plus appropriée.

 

exemple 5: utiliser les dispositifs du moteur pour repérer les types de ressources proposées

Par défaut Metacrawler établit un listing par ordre de pertinence décroissant, mais vous pouvez lui demander de trier en fonction des sources, c'est-à-dire selon le type d'organisation qui a mis en ligne le document visé. Pour reprendre notre problème fétiche, en cherchant Charon par exemple, nous aurions pu immédiatement écarter tout ce qui n'avait pas été publié par une institution éducative. Ici on nous donne sept sites éducatifs américains où figure notre mot-clé. Nous aurions pu alors appliquer comme auparavant notre filtre lexical, et ne retenir que deux liens, l'un vers Greek Mythology Link, l'autre vers Mythhand.
Comme il s'agit là de sites éducatifs nous n'aurions pas eu à nous soucier du danger d'éventuelles pages sataniques.