|
Projet Amaryllis
Lancé fin 1995, le projet Amaryllis a eu pour objet principal d’évaluer des logiciels de recherche d’information dans des corpus de texte en français et dégager une méthodologie reconnue pour l’évaluation de pareils outils de recherche. Amaryllis a été organisé par l’Institut de l’Information Scientifique et Technique (INIST) avec le soutien de l’Agence francophone pour l’enseignement supérieur et la recherche (AUPELF-UREF) et le Ministère de l’Education Nationale, de la Recherche et de la Technologie (MERT).
Dans le cadre de cette Action de Recherche Concertée (ARC A1, baptisée Amaryllis-Accès à l’information textuelle en français), il s’agissait plus précisément de créer des corpus de documents, des questions et des réponses en vue d’opérations proches de celles menées aux États-Unis dans le cadre de TREC.
Tous les corpus sont structurés en SGML avec codage des caractères en isolatin.
Les corpus disponibles ont été fournis par :
l’INIST (Institut de l’Information Scientifique et Technique)
l’OFIL (Observatoire Français et International des Industries de la Langue)
ELRA (Association Européenne pour les Ressources Linguistiques)
Chaque fournisseur a constitué trois types de corpus : documents textuels, thèmes de recherche et réponses à ces thèmes dans les corpus de documents (référentiels de réponses).
Amaryllis et CLEF (Cross-Language Evaluation Forum), le premier au niveau français, le second à l’échelle européenne, ont fusionné leurs activités très récemment. En effet, ces deux projets sont au coeur de l’activité d’évaluation, et devraient fournir pour 2002 un ensemble de collections de tests communes.
|