|
REGLES DE L’ALGEBRE DE BOOLE (REGLES BOOLEENNES) indispensables pour une recherche efficace par moteur de recherche
Contenu:
Tableau récapitulatif (PDF-File)
Moteurs de recherche et Boole
Différence entre un moteur de recherche et un site répertoire
Les principaux opérateurs booléens
Les opérateurs booléens exprimés en mots
La phrase entre guillemets
La combinaison de signes
Les parenthèses
Wildcards
Règles de l’algèbre booléenne dans un menu déroulant
Majuscules et minuscules
Singulier et pluriel
La saisie de mots à traiter par un moteur de recherche suit les règles de l’algèbre de Boole (les règles booléennes). De nombreux moteurs de recherche scientifiques et de moteurs de recherche de thèmes spéciaux (y compris la médecine) présupposent la connaissance des règles booléennes. Certains de ces moteurs n’utilisent toutefois qu’une petite partie des opérateurs booléens; il est donc possible que tous les opérateurs mentionnés ci-après ne fonctionnent pas avec tous les moteurs de recherche.
George Boole a vécu en Angleterre dans la première moitié du 19e siècle. Mathématicien et logicien, il est l’auteur d’une algèbre particulière qui est la base de la ‚logique floue’ utilisée aujourd’hui couramment, en électronique par exemple, ainsi que de la théorie des ensembles.
Les règles de l’algèbre de Boole sont utilisées par les moteurs de recherche afin d’obtenir des résultats d’une grande précision. Toutefois ce qu’on appelle un „moteur de recherche“ n’en est pas toujours un. Il convient de distinguer le „moteur de recherche“ et le „site répertoire“ ou „répertoire (ou catalogue) Web“. En règle générale, les règles booléennes ne sont pas utilisées dans les sites répertoires.
La différence entre un moteur de recherche et un site répertoire peut s’expliquer par l’exemple imagé suivant:
Imaginez un site Web sous forme de livre, de livre de cuisine par exemple.
Un site répertoire contiendra une phrase courte sur le livre en question, ainsi que quelques mots-clés pour la saisie. Exemples: recettes régionales, menus végétariens, fruits, légumes...
Un moteur de recherche, par contre, ne décrit pas le livre de cuisine en général, mais saisit l’ensemble du livre, chaque recette et chaque ingrédient, de la première à la dernière page, y compris l’achevé d’imprimer. La recherche prend alors deux aspects différents.
Imaginons qu’il s’agit d’un livre de cuisine végétarienne. En recherchant "légumes" dans le site répertoire, on obtiendra une quantité raisonnable d’occurences (de résultats de recherche) sur le sujet. Les catégories listées permettront de trouver très rapidement les pages concernant les légumes.
Par contre, la recherche de "tomate" ou "céleri" dans le site répertoire ne fournira aucun résultat, puisque ces mots renvoient à des ingrédients et que le site répertoire ne contient que le titre de la recette ou la catégorie où elle est rangée.
Il en va différemment d’un moteur de recherche. Celui-ci ne contenant pas seulement le titre, mais la recette entière, la recherche de "tomate" ou "céleri" livrera toutes les recettes contenant cet ingrédient.
Toutefois, si l’on recherche le mot général de "légumes" en ayant recours à un moteur de recherche, on obtiendra une quantité incommensurable d’occurences.
C’est là qu’interviennent les opérateurs booléens ainsi que des mots plus précis à rechercher, à moins qu’on se contente d’un site répertoire.
Dans la pratique, une collaboration raisonnée s’est instaurée depuis pas mal de temps entre les sites répertoires et les moteurs de recherche.
Dans l’exemple ci-dessus, la recherche de "céleri" dans
Yahoo
ne fournira aucun résultat. C’est pourquoi Yahoo a recours automatiquement au moteur de recherche
Google,
ce dont la pesonne qui fait la recherche n’est pas avertie. Il n’est donc pas faux d’utiliser des opérateurs booléens aussi quand on consulte un site répertoire. Il faudra juste se rendre compte que les occurences obtenues ne proviennent pas du site répertoire, mais d’un moteur de recherche externe.
Site répertoire  Les sites proposés à l’enregistrement dans un site répertoire sont examinés d’un point de vue rédactionnel. Ce qui veut dire que les rédacteurs du site répertoire examinent de près le site proposé et décident de son inclusion ou non dans le site répertoire. Pour s’assurer que ses données seront incorporées dans le site répertoire, le concepteur d’un site doit s’enregistrer personnellement auprès du site répertoire. Seuls les sites importants très connus sont enregistrés sans inscription préalable. Les pages concernées sont ensuite réparties en diverses catégories. L’index même ne comportera que quelques indications telles que le titre, la description du site, quelques mots-clés et la catégorie dont le site relève.
Moteur de recherche  La caractéristique la plus importante d’un moteur de recherche, c’est l’indexation automatique des sites. L’index incorpore bien davantage de données qu’un site répertoire.
En fonction du type de moteur de recherche, ces données comprennent le titre, les premières lignes de chaque page du site ou le document Web entier (indexation du texte complet). Ce qui fait qu’un moteur de recherche propose un bien plus grand nombre d’occurences et qu’il faut mobiliser davantage de critères (opérateurs booléens et mots à rechercher) afin de limiter le nombre d’occurences.
À défaut de saisir un opérateur booléen, on recherchera les documents contenant au moins l’un des mots recherchés.
En reliant deux ou plusieurs mots à rechercher par le signe (l’opérateur) +, la recherche se limitera aux documents contenant tous les mots ainsi reliés.
Quant à l’opérateur -, il limite la recherche aux documents ne contenant pas le mot qui suit le signe -.
Saisie de chien chat à traiter par le moteur de recherche
Recherche de tous les documents contenant le mot ‚chien’ ou le mot ‚chat’.
Saisie de +chien +chat à traiter par le moteur de recherche
Recherche de tous les documents où figurent simultanément le mot ‚chien’ et le mot ‚chat’.
Saisie de +chien –chat à traiter par le moteur de recherche
Recherche de tous les documents où figure le mot ‚chien’, mais pas le mot ‚chat’.
LES SIGNES +, - PEUVENT ÊTRE UTILISÉS PAR TOUS LES MOTEURS DE RECHERCHE.
L’opérateur OR élargit la recherche en stipulant que seul l’un des mots à rechercher reliés par OR doit figurer dans le résultat de la recherche, mais il est assez rarement utilisé. Combiné avec d’autres opérateurs, il peut toutefois s’avérer très utile (voir les „Parenthèses“).
En combinant par AND deux ou plusieurs mots à rechercher, la recherche ne portera que sur des documents où figurent tous les mots reliés de la sorte.
L’opérateur NOT limite la recherche en excluant le mot qui suit NOT et qui ne devra pas figurer dans le résultat de la recherche.
L’opérateur NEAR veille à ne rechercher que les documents où deux ou plusieurs mots recherchés figurent dans une relation de proximité, sans que l’ordre où ils apparaissent soit important.
L’opérateur FAR fonctionne de manière analogue à l’opérateur NEAR, à cette différence près que la distance entre les mots recherchés est plus grande. Ici aussi, l’ordre où apparaissent les mots recherchés n’est pas important.
L’opérateur ADJ recherche les documents où les mots recherchés sont adjacents, sans que l’ordre où ils apparaissent soit important.
L’opérateur SENTENCE veille à ne répertorier que les documents où deux ou plusieurs mots recherchés figurent dans la même phrase, sans que l’ordre où ils apparaissent soit important.
L’opérateur PARAGRAPH veille à ne répertorier que les documents où deux ou plusieurs mots recherchés figurent dans le même alinéa, sans que l’ordre où ils apparaissent soit important.
L’opérateur BEFORE veille à ne répertorier que les documents où les mots recherchés se suivent dans l’ordre prescrit. Attention: ici, l’ordre où ces mots apparaissent a de l’importance!
Saisie à traiter par le moteur de recherche: chien OR chat
Recherche de tous les documents où figurent le mot ‚chien’ ou le mot ‚chat’.
Saisie à traiter par le moteur de recherche: chien AND chat
Recherche de tous les documents où figurent simultanément le mot ‚chien’ et le mot ‚chat’.
Saisie à traiter par le moteur de recherche: chien NOT chat
Recherche de tous les documents où figure le mot ‚chien’, mais pas le mot ‚chat’.
Saisie à traiter par le moteur de recherche: chien NEAR chat
Recherche de tous les documents où figurent simultanément le mot ‚chien’ et le mot ‚chat’, les deux mots ne devant pas être séparés par plus de 10 mots en règle générale.
Saisie à traiter par le moteur de recherche: chien FAR chat
Recherche de tous les documents où figurent simultanément le mot ‚chien’ et le mot ‚chat’, les deux mots devant être séparés d’au moins 25 mots en règle générale.
Saisie à traiter par le moteur de recherche: chien ADJ chat
Recherche de tous les documents où figurent simultanément le mot ‚chien’ et le mot ‚chat’ se suivant immédiatement.
Saisie à traiter par le moteur de recherche: chien SENTENCE chat
Recherche de tous les documents où figurent simultanément, dans la même phrase, le mot ‚chien’ et le mot ‚chat’.
Saisie à traiter par le moteur de recherche: chien PARAGRAPH chat
Recherche de tous les documents où figurent simultanément, dans le même alinéa, le mot ‚chien’ et le mot ‚chat’.
Saisie à traiter par le moteur de recherche: chien BEFORE chat
Recherche de tous les documents où figurent le mot ‚chien’ suivi du mot ‚chat’, quel que soit le nombre de mots qui les séparent.
CE MODE D’ÉCRITURE (OR, AND, NOT, NEAR, FAR, ADJ, SENTENCE, PARAGRAPH, BEFORE) EST EXIGÉ EXPRESSÉMENT PAR DES MOTEURS DE RECHERCHE SPÉCIAUX; MAIS EXCLU PAR D’AUTRES.
Une phrase entre guillemets, ce sont deux ou plusieurs mots qui devront se retrouver dans les documents recherchés à la suite l’un de l’autre dans le même ordre. Nombre de services de recherche utilisent les guillemets pour la recherche de phrases, tandis que d’autres ont recours à un menu déroulant.
Saisie de termes composés: "facteur de nécrose tumorale"
Recherche de tous les documents où figurent les mots de la phrase ‚facteur de nécrose tumorale’ à la suite l’un de l’autre dans le même ordre.
Saisie de noms d’auteurs: "sigmund freud"
Recherche de tous les documents où figurent les mots de la phrase ‚sigmund freud’ à la suite l’un de l’autre dans le même ordre.
Saisie de citations: "votre partenaire pour des informations sur les médicaments"
Recherche de tous les documents où figurent les mots de la phrase ‚votre partenaire pour des informations sur les médicaments’ à la suite l’un de l’autre dans le même ordre.
Les différents opérateurs peuvent aussi être combinés pour assurer une recherche plus précise.
Saisie à traiter par le moteur de recherche: +dystrophie +ovarienne –polykystique
Recherche de tous les documents où figurent simultanément le mot ‚dystrophie’ et le mot ‚ovarienne’, mais pas le mot ‚polykystique’.
Saisie à traiter par le moteur de recherche: +"facteur de nécrose tumorale" +"infarctus du myocarde"
Recherche de tous les documents où figurent simultanément les phrases ‚facteur de nécrose tumorale’ et ,infarctus du myocarde’.
Saisie à traiter par le moteur de recherche: +"sigmund freud" –œdipe
Recherche de tous les documents où figure la phrase ‚sigmund freud’, mais pas le mot ‚œdipe’.
Les deux parenthèses regroupent différents opérateurs, ce qui s’avère très pratique pour une recherche ciblée.
Saisie à traiter par le moteur de recherche: dystrophie AND (ovarienne OR polykystique)
Recherche de tous les documents où figurent simultanément le mot ‚dystrophie’ et le mot ‚ovarienne’, ainsi que tous les documents où figurent simultanément le mot ‚dystrophie’ et le mot ‚polykystique’.
Saisie à traiter par le moteur de recherche: (dystrophie AND ovarienne) OR polykystique
Recherche de tous les documents où figurent simultanément le mot ‚dystrophie’ et le mot ‚ovarienne’, ainsi que tous les documents où figure le mot ‚polykystique’.
De nombreux moteurs de recherche offrent la possibilité d’une recherche par wildcards ou caractères génériques, exprimés par les opérateurs * ou ?. Les wildcards peuvent se trouver au début, au milieu ou à la fin d’un mot.
L’opérateur ? remplace généralement un seul caractère, alors que l’opérateur * remplace normalement jusqu’à cinq caractères.
C’est notamment lors de la saisie de mots allemands à rechercher que les wildcards s’avèrent utiles, puisque les déclinaisons et conjugaisons propres à l’allemand risquent de changer l’allure de ces mots.
Saisie à traiter par le moteur de recherche: ?aison
Recherche de tous les documents où figurent par exemple les mots ‚raison’, ‚saison’ ou ‚maison’.
Saisie à traiter par le moteur de recherche: *aison
Recherche de tous les documents où figurent par exemple les mots ‚raison’, ‚saison’, ‚maison’, ‚fenaison’, ’pendaison’ ou ‚venaison’.
Saisie à traiter par le moteur de recherche: pilo?
Recherche de tous les documents où figurent par exemple les mots ‚pilon’, ‚pilot’ ou ‚pilou’.
Saisie à traiter par le moteur de recherche: bouch*
Recherche de tous les documents où figurent par exemple les mots ‚bouche’, ‚boucherie’ ou ‚bouchon’.
Choix dans le menu déroulant: 'any of the words'
Correspondant à l’opérateur OR
Choix dans le menu déroulant: 'all of the words'
Correspondant à l’opérateur + ou AND
Choix dans le menu déroulant: 'the exact phrase'
Correspondant à l’opérateur "..."
… etc.
DANS CE CAS, ON SAISIT LES MOTS À RECHERCHER ET ON CHOIISIT DANS LE MENU LES OPÉRATEURS DÉSIRÉS.
Saisie à traiter par le moteur de recherche: +cardiology +journal
Le moteur de recherche répertorie tous les documents où figurent les mots ‚cardiology' ou ‚Cardiology' et ‚journal' ou ‚Journal'.
Saisie à traiter par le moteur de recherche: +Cardiology +Journal
Le moteur de recherche répertorie tous les documents où figurent les mots ‚Cardiology' et ‚Journal'.
CERTAINS MOTEURS DE RECHERCHE NE TIENNENT PAS COMPTE DES MAJUSCULES. IL EST CONSEILLÉ DE TOUJOURS COMMENCER LES MOTS RECHERCHÉS PAR UNE LETTRE MINUSCULE.
Saisie à traiter par le moteur de recherche: +cardiology +journal
Le moteur de recherche répertorie tous les documents où figurent les mots ‚cardiology' et ‚journal' ou ‚journals' commençant ou non par une majuscule.
Saisie à traiter par le moteur de recherche: +cardiology +journals
Le moteur de recherche répertorie tous les documents où figurent les mots ‚cardiology' et ‚journals' commençant ou non par une majuscule.
DONC: TOUJOURS METTRE AU SINGULIER LES MOTS À RECHERCHER.
|