|
Réseau mondial des centres de distribution de Ressources Linguistiques
ELRA-S0157 Corpus NetDC d’actualités radio-diffusées arabes
ELDA conduit avec son homologue américain LDC (Linguistic Data Consortium) le projet Network-DC, qui vise à harmoniser les activités et les opérations des centres de distribution de ressources linguistiques au niveau mondial. Les ressources seront disponibles pour les secteurs de la recherche, l’éducation et l’industrie.
Dans le cadre du projet Network-DC, ELDA et LDC mènent en collaboration une collecte de données à grande échelle, avec la production, l’acquisition, la normalisation, la validation et la distribution de données textuelles et orales, pour la recherche et le développement. Cette approche pragmatique est nécessaire d’une part, pour s’assurer que le projet est réalisable, et d’autre part pour permettre la mise en place d’un modèle de coopération dans les domaines des licences, de la distribution et des normes.
La mise en place d’un réseau des centres de distribution de ressources linguistiques va faciliter l’accès à ces ressources, disponibles sous format électronique, actuellement gérées de façon très disparate.
Le projet va ainsi permettre de poser les fondements d’une coopération entre ELDA et LDC, coopération étroite couvrant les différents aspects de la gestion des ressources linguistiques.
Sur le plan européen, jusqu’à 5 émissions radiodiffusées seront enregistrées dans les différentes langues, tandis que du côté américain, un corpus comprenant les échantillons de 45 langues enregistrées par Voice of America sera créé.
Début du projet
Décembre 2000
Durée
17 mois
Coordinateur
European Language Resources Distribution Agency - ELDA
Contact
Khalid Choukri, directeur exécutif d’ELDA,
Contact
ELDA, 55-57 rue Brillat Savarin 75013, Paris, France
Tel : +33 1 43 13 33 33, Fax : +33 1 43 13 33 30,
Participants
Linguistic Data Consortium - LDC (US)
Speech Processing Expertise Centre - SPEX (NL)
|