ELRA ELRA
  Accueil Catalogue
Ressources Linguistiques
Rapports d'incidents
Envoyez-nous vos rapports d'incidents.
Consulter le catalogue
 
Utilisez des mots-clés pour trouver le produit que vous recherchez.
Recherche avancée
Langue(s)
Anglais Français
Informations
  • Procédure & Conditions d'achat

  • Prix et licences d'utilisation

  • Comment promouvoir vos ressources ?

  • Contactez-nous
  • Référence Catalogue : ELRA-T0373
    BioLexicon
    BioLexicon est une ressource terminologique en anglais de grande envergure développée dans l’objectif de répondre aux besoins grandissants des efforts de text mining dans le domaine biomédical. Elle comprend des informations concernant :
    - les noms terminologiques, y compris les verbes nominalisés et les noms propres (par exemple, les noms des gènes)
    - les adjectifs terminologiques
    - les adverbes terminologiques
    - les verbes terminologiques
    - des mots de l’anglais général fréquemment utilisés dans le domaine de la biologie

    Les informations sur les termes déjà existantes ont été intégrées, augmentées, completées et mises en relation, grâce au traitement d’un large nombre de textes du domaine biomédical, pour finalement produire entre autres plus de 2,2 millions d’entrées lexicales (plus de 3,3 millions de relations sémantiques), ainsi que des informations sur plus de 1,8 millions de variantes et plus de 2 millions de relations synonymiques. De plus, des informations très complètes sont fournies sur la manière dont les verbes (notamment les verbes nominalisés dans le domaine) se comportent aux niveaux à la fois syntaxique et sémantique, permettant ainsi son utilisation dans des applications visant à mettre en évidence des relations et des événements impliquant des entités biologiques dans le texte. BioLexicon contient des verbes spécifiques au domaine (658), inclut des cadres de sous-catégorisation syntaxique extraits automatiquement (1710), ainsi que des cadres des situations sémantiques (850), qui sont basés sur l’annotation de corpus par des experts du domaine.

    Cette couverture très complète des termes de biologie fait de BioLexicon une ressource linguistique unique dans ce domaine. Elle a pour but premier d’aider les travaux de text mining et de recherche d’information dans le domaine biomédical, même si sa structure basée sur des standards et un contenu riche en font une ressource de qualité pour beaucoup d’autres types d’applications.

    Dans la première phase de construction de BioLexicon, les termes potentiels ont été rassemblés à partir de différentes ressources représentant des types sémantiques sélectionnés pour traiter différentes entités telles que les gènes et les protéines, les composants chimiques, les espèces, les enzymes, ainsi que diverses entités identifiées dans les ontologies relatives à la biologie.

    Les termes ont été alors organisés en ensembles de variantes synonymiques et annotés avec un certain nombre de traits statiques qui améliorent la résolution de l’ambiguïté du terme. Une fois alimenté de termes provenant d’inventaires existants, des variantes des termes extraits de littérature scientifique et complétés par des éléments lexicaux sélectionnés manuellement ont été ajoutés dans BioLexicon (tels que des verbes et des expressions de mot composés pertinents en biologie). Des informations linquistiques ont été ajoutées aux entrées, sur la base du traitement de corpus, y compris des informations sur la sous-catégorisation syntaxique des verbes et les verbes nominalisés, ainsi que des informations sur les cadres d’événements sémantiques. Enfin, un sous-ensemble de termes de BioLexicon sont reliés aux concepts d’ontologie en régulation génétique afin d’assurer l’identification d’événements dans le domaine de la régulation génétique.

    Le schéma de BioLexicon conserve les annotations des termes et les métadonnées dérivées des données d’origine. Dans un même temps, il propose une représentation lexicale cohérente des termes de types sémantiques différents. Ainsi, BioLexicon présente l’avantage évident d’un format lexical uniforme pour une large couverture de la terminologie relative à la biologie, accompagné d’informations linguistiques.

    BioLexicon est disponible sous la forme d’une base de données relationnelle (format dump MySQL). Il adhère également aux standards EAGLES/ISO relatifs aux ressources lexicales.

    ISLRN : 152-047-849-795-0
    Informations techniques
    Support de distribution : Downloadable
    Contenus Cliquer sur la flèche afin d'afficher les informations des contenus.
    terminology 
     
    Prix Membres
    Academic - Commercial 9000.00 EUR
    Academic - Research 200.00 EUR
    Commercial - Commercial 9000.00 EUR
    Commercial - Research 4500.00 EUR
    Prix Non Membres
    Academic - Commercial 11000.00 EUR
    Academic - Research 320.00 EUR
    Commercial - Commercial 11000.00 EUR
    Commercial - Research 6000.00 EUR

    Copyright © 2008 ELRA
    ELRACatalogue 0.8.0