[Requête simple] [AltaVista Network] [Aide à la requête]

Aide sur les requêtes évoluées uniquement. Ne concerne pas les requêtes simples!

(Pour accéder aux pages d'aide relatives aux requêtes simples, cliquez sur Requête simple, puis sur Aide.)

Les requêtes évoluées utilisent des opérateurs et des syntaxes d'expression pour construire des requêtes. Toutefois, les règles servant à définir les mots, les phrases, la mise en majuscule et les caractères génériques sont identiques à celles des requêtes simples.

Utiliser les opérateurs binaires AND, OR, et NEAR, et l'opérateur unaire NOT

kayak AND "San Juan Islands"
L'opérateur AND garantit que les deux éléments sont présents dans les documents résultants. L'opérateur AND lie les éléments de façon moins contraignante que la juxtaposition.
"Digital Equipment Corporation" OR DEC
L'opérateur OR garantit que au moins un élément figure dans les documents résultants. L'opérateur OR est moins contraignant que l'opérateur AND.
Louis NEAR Monier
L'opérateur NEAR garantit que les deux éléments figurent à moins de dix mots l'un de l'autre dans les documents résultants. L'opérateur NEAR est moins contraignant que l'opérateur NOT et associe les éléments vers la gauche. Cette requête correspond à Louis Monier , Louis M. Monier et Monier, Louis.
légumes AND NOT "choux de Bruxelles"
L'opérateur NOT est utilisé pour exclure des mots ou des phrases d'une requête. L'opérateur NOT lie de façon moins contraignante que l'opérateur OR. Cette requête est équivalente à légume and (not "choux de Bruxelles"). N'utilisez pas légume NOT "choux de Bruxelles"; cette requête n'est pas conforme du point de vue syntaxique.


Exemples illustrant l'importance des parenthèses

gold OR silver AND platinum
gold OR (silver AND platinum)
(gold OR silver) AND platinum
Les deux premières requêtes sont équivalentes. Elles renvoient des documents contenant à la fois silver et platinum, ainsi que des documents contenant gold.
Si vous voulez que la recherche porte sur des documents contenant platinum et, dans le même document, gold ou silver, vous devez utiliser le troisième schéma de requête.

not gold and silver
(not gold) and silver
not (gold and silver)
Les deux premières requêtes sont équivalentes. Elles renvoient des documents contenant silver mais pas gold.
Si vous voulez que la recherche élimine les documents contenant à la fois gold et silver, vous devez utiliser le troisième schéma de requête.

gold near silver and platinum
(gold near silver) and platinum
(gold near silver) and (gold near platinum)
Les deux premières requêtes sont équivalentes. Elles renvoient des documents contenant gold situé dans le proche voisinage de silver, et dans le même document, le mot platinum.
Si vous voulez que la recherche porte sur des documents contenant gold situé dans le proche voisinage de silver et, dans le même document, gold à proximité de platinum, vous devez utiliser le troisième schéma de requête.

not gold near silver
not (gold near silver)
silver and not (gold near silver)
Les deux premières requêtes sont équivalentes. Elles éliminent de la recherche tous les documents contenant silver situé dans le proche voisinage de gold.
Si vous voulez que la recherche porte sur des documents contenant silver et qu'elle élimine ceux dans lesquels figure gold à proximité de silver, vous devez utiliser le troisième schéma de requête.

gold near silver or platinum
(gold near silver) or platinum
Les deux requêtes ci-dessus sont équivalentes. Elles portent sur des documents contenant gold situé dans le proche voisinage de silver, ainsi que des documents contenant platinum.

gold near (silver or platinum)
(gold near silver) or (gold near platinum)
Les deux requêtes ci-dessus sont équivalentes. Elles portent sur des documents contenant gold situé dans le proche voisinage de silver, ainsi que des documents contenant gold à proximité de platinum.

Comment fonctionnent les recherches : requêtes évoluées

Pour simplifier la description ci-après, nous considérons la zone de saisie Critères de sélection comme zone de recherche, et celle intitulée Critères de classement des résultats comme zone de classement.
Comment AltaVista exécute les requêtes
Les requêtes simples et les requêtes évoluées représentent les différentes interfaces d'un même moteur de recherche. Cela dit, il peut vous paraître surprenant que, dans certaines conditions, des requêtes apparemment identiques génèrent des résultats légèrement différents, selon que vous les soumettez comme requêtes simples ou comme requêtes évoluées.

Comparez, par exemple, une requête simple composée d'un seul mot, à savoir plato, à une requête évoluée composée du même mot, sans spécifier de classement. Cette requête renvoie plato dans la zone de recherche et rien dans la zone de classement. Chacune des deux requêtes produit environ 20000 documents, mais le classement est différent dans chacun des cas.

L'explication des différences de classement est particulièrement complexe. Pour résumer, AltaVista met en place des requêtes simples comme des requêtes évoluées. Plus précisément, une requête simple devient une expression booléenne accompagnée d'un ensemble de mots servant à classer les résultats.

Dans l'exemple ci-dessus, AltaVista met en place la requête simple composée du mot plato, en tant que requête évoluée avec rien dans la zone de recherche, mais avec plato dans la zone de classement. Rappelez-vous que dans cet exemple, la requête évoluée comprenait plato dans la zone de recherche et rien dans la zone de classement; autrement dit, les deux requêtes n'étaient pas réellement identiques, d'où les différents classements.

Si vous soumettez une autre requête évoluée, comprenant cette fois plato à la fois dans la zone de recherche et dans la zone de classement, les classements des documents satisfaisant la requête seront également identiques à ceux produits par la requête simple pour plato.

Pour résumer, les trois requêtes suivantes produisent les mêmes résultats dans le même ordre de classement.

        Type de requête               zones             Mot de requête 
      ============================================================
        Simple                   recherche seule           plato 
      ------------------------------------------------------------
        Evoluée                    recherche               ---  
                                   classement              plato
      ------------------------------------------------------------
        Evoluée                    recherche               plato 
                                   classement              plato
      ------------------------------------------------------------
  
       
La requête ci-après génère les mêmes occurrences que les requêtes ci-dessus, sans ordre de classement particulier.
        Type de requête           zones            Mot de requête
      ============================================================
        Evoluée                   recherche            plato 
                                  classement           ----
      ------------------------------------------------------------



Comment AltaVista classe les requêtes évoluées
Utilisez la zone de saisie intitulée Critères de classement des résultats pour saisir les mots et les phrases qui détermineront le classement des résultats de recherche. Gardez en mémoire que le classement d'une requête évoluée est équivalent à l'exécution d'une requête simple; le même algorithme de résultat est utilisé dans les deux cas. Les documents comprenant un résultat élevé figurent en début de liste. Les résultats sont élevés lorsque le mot de classement sélectionné apparaît dans les premiers mots du document (c'est-à-dire, dans le titre d'une page Web ou dans un en-tête) ou lorsque le document comprend plusieurs occurrences du mot de classement.

Voici un exemple de requête sans précision de classement.
      Zone de recherche          (gold near silver) and platinum
      Zone de classement         
      Résultat                   2000 documents trouvés et 
répertoriés sans ordre particulier.
   
Les 2000 documents trouvés contiennent les mots gold dans le proche voisinage de silver et, dans le même document, le mot platinum. Si vous choisissez maintenant platinum pour classer les résultats de recherche, la requête génère les 2000 documents classés par ordre d'occurrences et les résultats les plus élevés pour platinum figurent en début de liste.

      Zone de recherche          (gold near silver) and platinum
      Zone de classement         platinum
      Résultat                   2000 documents trouvés et 
classés pour que
                                 les scores les plus élevés pour 
platinum figurent en début de liste. 
     
Vous pouvez aller encore plus loin. Commes les documents contenant les occurrences correspondant à ces métaux peuvent également comprendre des références à d'autres métaux, vous pouvez vérifier les références à un autre métal. Cependant, notez à quoi ressemblent les résultats de la recherche.
      Zone de recherche           (gold near silver) and platinum
      Zone de classement          palladium
      Résultat		          200 documents trouvés
     
Dans ce cas, la requête évoluée n'a pas renvoyé les 2000 documents résultant de cette recherche et les a reclassé pour que ceux dans lesquels des occurrences de palladium figurent en début de liste. Un second niveau de filtrage a été appliqué aux résultats de recherche; les 1800 documents ne comprenant pas d'occurrences de palladium ont été supprimés. En d'autres termes, lorsque la zone de classement n'est pas vide, les documents qui ne contiennent aucun des mots figurant dans la zone de classement sont supprimés.

Recherches restrictives

Il est possible de limiter les recherches à certaines parties de documents à l'aide de la syntaxe suivante. Le mot clé (link, title, image,...) doit figurer en minuscules et être immédiatement suivi de deux points.

Recherches restrictives dans les pages Web :

anchor:click-here
Trouve des pages dans lesquelles la phrase click here figure dans le texte d'un hyperlien.
applet:NervousText
Trouve des pages contenant le nom des classes d'objets Java trouvé dans une marque objet ; dans ce cas, NervousText.
host:digital.com
Trouve des pages dans lesquelles la phrase digital.com figure dans le nom hôte du serveur Web.
image:comet.jpg
Trouve des pages avec comet.jpg figurant dans un caractère image.
link:thomas.gov
Trouve des pages qui contiennent au moins un lien à une page comprenant thomas.gov dans son adresse URL.
text:algol68
Trouve des pages qui contiennent le mot algol68 dans n'importe quelle partie du texte visible sur la page. (A savoir, le mot n'est ni un lien, ni une image, par exemple.)
title:"The Wall Street Journal"
Trouve des pages contenant la phrase The Wall Street Journal dans le titre.
url:home.html
Trouve des pages avec les mots home et html figurant dans l'adresse URL de la page. Equivaut à url:"home html".

Recherches restrictives dans les articles Usenet :

from:napoleon@elba.com
Trouve les articles dans lesquels les mots napoleon@elba.com figurent dans la From: zone.
subject:"à vendre"
Trouve les articles dans lesquels la phrase à vendre figure dans la Subject: zone.
Vous pouvez combiner cette recherche à un mot ou à une phrase. Par exemple, subject:"à vendre" "pots de chambre victoriens".
newsgroups:rec.humor
Trouve les articles imputés dans des groupes d'informations avec rec.humor dans le nom.
summary:invest*
Trouve les articles avec le mot invest, investment, investiture, etc., dans le résumé.
keywords:NASA
Trouve les articles avec le mot NASA en minuscules/majuscules dans la liste des mots clés.

Informations complémentaires sur les mots, les phrases, la mise en majuscule, les accents et la troncature *

Mots

AltaVista traite chaque page du Web et chaque article Usenet comme une séquence de mots. Un mot dans ce contexte représente n'importe quelle chaîne de lettres et de chiffres délimitée par des marques de ponctuation, par des caractères non alphabétiques (par exemple, &, %, $, /, #, _, ~) ou par des espaces (espaces, tabulations, fin de ligne, début de document, fin de document). Pour être considéré comme un mot, il n'est pas nécessaire qu'une chaîne de caractères alphanumériques soit orthographiée correctement ou figure dans un dictionnaire. Il suffit que le mot soit saisi dans une page Web ou dans un article Usenet. Par conséquent, les exemples ci-après constituent des mots s'ils sont délimités dans un document : HAL5000, Gorbachevnik, 602e21, www, http, EasierSaidThanDone, etc. Les exemples ci-après sont considérés comme deux mots car une ponctuation interne les sépare : don't, digital.com, x-y, AT&T, 3.14159, U.S., All'sFairInLoveAndWar.

Seuls les mots figurant dans un document ont un sens pour AltaVista. AltaVista n'indexe ni la ponctuation ni les espaces blancs ; par conséquent, vous ne pouvez utiliser AltaVista que pour effectuer des recherches portant sur des mots ou des phrases et non pas sur la ponctuation.

Phrases

Une phrase est une chaîne de mots contigus dans un document, en dépit du fait qu'ils puissent être séparés par des espaces ou des marques de ponctuation. Il n'est pas nécessaire qu'elle soit conforme aux règles grammaticales--elle doit juste apparaître dans un document comme une séquence de mots adjacents. Voici quelques exemples :

La ponctuation et les espaces n'ayant pas de sens pour AltaVista (à l'exception des marques qui délimitent les mots), les phrases ci-dessus ne peuvent pas être distinguées des variantes ci-après :

Il existe deux conventions relatives à la saisie d'une phrase dans une requête. Pour éviter les ambiguïtés, il est préférable de saisir la phrase comme "une séquence de mots séparés par des espaces et encadrée par des guillemets". Toutefois, vous pouvez saisir les mots d'une phrase avec des marques de ponctuation (sans espace) entre chaque paire de mots. Par exemple, les requêtes suivantes sont toutes équivalentes :

Il est recommandé d'utiliser la première. Gardez en mémoire que les caractères de ponctuation & | ! et ~ ont une signification dans les requêtes évoluées et que l'astérisque * indique la troncature * utilisée à la fois dans les requêtes simples et évoluées.

Mise en majuscule

Les lettres majuscules sont considérées différemment des minuscules. Lorsqu'un mot est localisé dans une page Web ou dans un article, sa forme est préservée lorsqu'il est stocké dans l'index.

Lorsque vous saisissez un mot dans une requête, il est recommandé de le saisir entièrement en minuscules, car le résultat ne distinguera pas les majuscules des minuscules. Si vous introduisez des majuscules, le résultat tiendra compte de l'èquivalence exacte du mot entier.

Par conséquent le mot turkey dans une requête correspondra aux occurrences turkey, Turkey, tUrKeY ou TURKEY figurant dans un document. Mais le mot en majuscules Turkey dans une requête correspond uniquement à l'occurrence Turkey dans le document et à aucune autre variante.

Accents

Les accents sont traités de la même façon que les majuscules. Un mot comprenant des accents utilisé dans une requête implique une équivalence exacte du mot entier. Par exemple, si vous utilisez éléphant dans une requête, vous n'obtiendrez que l'équivalent de l'orthographe française. Toutefois, si vous ne saisissez pas les accents dans la fenêtre de recherche (dépendante du clavier, du navigateur et de la plate-forme), vous obtiendrez des occurrences correspondant à la fois aux orthographes française et anglaise.

La troncature *

Pour rechercher les occurrences de n'importe quel groupe de mots ayant le même modèle, AltaVista propose la troncature *. Par exemple, vous voulez rechercher les occurrences de sing, singer, singers, singing. Dans ce cas, placez la troncature * à la fin du mot pour lequel vous souhaitez inclure les flexions dans la recherche : sing*. Attention! AltaVista établira également des correspondances sans aucune pertinence lexicale avec le mot de la requête. Par conséquent, la requête sing* établira également des correspondances de singe, single, singular, et de termes étrangers tels que le mot français singulier.

La troncature * ne peut pas être utilisée sans restriction. Pour que de telles requêtes puissent être exécutées par informatique, AltaVista requiert que l'astérisque * ne soit utilisé qu'après trois lettres au minimum. La troncature * établira des correspondances équivalant à cinq lettres supplémentaires en minuscules seulement. Par conséquent, ni les majuscules, ni les chiffres ne peuvent être compris dans la correspondance.

La troncature * peut parfois s'avérer utile pour trouver les différentes orthographes d'un mot : par exemple, cantalo* établira des correspondances pour cantaloup, cantaloupe, cantalope, et leurs pluriels. Soyez prudent lorsque vous construisez votre requête. Par exemple, si vous voulez établir des correspondances pour color and colour, une requête du type col*r n'est pas la plus efficace. Cette requête établira également des correspondances pour collector et collider. Dans ce cas, il est plus approprié de soumettre la requête colo*r, qui établira à la fois des correspondances pour color et colour.

Enfin, si votre recherche à l'aide de la troncature * trouve trop d'occurrences, AltaVista ignore la requête. La requête inte*, par exemple, produit le résultat,

Ignored  inte*: 4292323  
No documents match this query


La commande META : contrôler l'indexation de votre page Web par AltaVista

En l'absence de toute autre information, AltaVista indexe tous les mots figurant dans le document (à l'exception des commentaires) et utilise les premiers mots du document comme résumé.

Toutefois, il est possible de contrôler l'indexation de votre page Web à l'aide de la commande META pour spécifier à la fois des mots clés supplémentaires et une description concise. Supposons que votre page contienne :

<META  name="description" 
content="We specialize in grooming pink poodles.">
<META  name="keywords" content="pet grooming, Palo Alto, dog">
AltaVista procède de la façon suivante :
Pink Poodles Inc
We specialize in grooming pink poodles.
http://pink.poodle.org/ - size 3k - 29 Feb 96

AltaVista indexe la description et les mots clés dans une limite de 1024 caractères.


Autorisations . FAQ . Ajouter des adresses URL . Vos réactions . Images
Faites-vous connaître sur AltaVista

Telia
Digital Equipment Corporation.
Copyright 1997 © All rights reserved.