ELRA ELRA
  Accueil Catalogue
Ressources Linguistiques
Rapports d'incidents
Envoyez-nous vos rapports d'incidents.
Consulter le catalogue
 
Utilisez des mots-clés pour trouver le produit que vous recherchez.
Recherche avancée
Langue(s)
Anglais Français
Informations
  • Procédure & Conditions d'achat

  • Prix et licences d'utilisation

  • Comment promouvoir vos ressources ?

  • Contactez-nous
  • Référence Catalogue : ELRA-L0099
    Dictionnaire arabe de mots fléchis avec reconnaissance de clitiques agglutinés et système de flexions
    Le dictionnaire arabe de mots fléchis avec reconnaissance de clitiques agglutinés et système de flexions comprend une liste de 6 millions de formes fléchies, entièrement voyellisées, générées en conformité avec les régles grammaticales de l’arabe et étiquetées avec des informations grammaticales comprenant la partie du discours et les attributs grammaticaux, dont le nombre, le genre, le cas, la définitude, le temps, le mode et la compatibilité avec l’agglutination de clitiques.

    Il est accompagné d’une ressource grammaticale qui permet de reconnaître des centaines de millions de mots valides agglutinés, c’est-à-dire des mots comportant l’une des formes du dictionnaire précédée et/ou suivie de clitiques (conjonctions, prépositions, articles, pronoms), conformément aux régles grammaticales de l’arabe.

    Afin de permettre la mise à jour du dictionnaire, un dictionnaire de 65 000 lemmes est également fourni ainsi que les données requises pour permettre de produire les flexions et regénérer le dictionnaire, ce qui permet d’adapter le dictionnaire à des applications spécifiques en supprimant et/ou ajoutant des entrées.

    La ressource couvre plus de 98% des formes trouvées dans tout type de littérature, articles de journaux, etc. Les 2% restants incluent des noms propres ce qui peut s’avérer pertinent pour certains traitements.

    Les données sont formattées aux formats Unitex/GramLab, un système de traitement de corpus open source. Ces formats sont documentés publiquement. Les données peuvent être soit utilisées directement avec Unitex/GramLab ou converties dans des formats spécifiques à l’utilisateur.

    Ce dictionnaire est également disponible sans reconnaissance de clitiques agglutinés et sans système de flexions dans le Catalogue ELRA sous la référence ELRA-L0098.

    Auteurs: Alexis NEME et Eric LAPORTE

    ISLRN : 963-860-792-289-9
    Informations techniques
    Support de distribution : Downloadable
    Contenus Cliquer sur la flèche afin d'afficher les informations des contenus.
    written lexicon 
     
    Prix Membres
    Academic - Commercial 25000.00 EUR
    Commercial - Commercial 25000.00 EUR
    Prix Non Membres
    Academic - Commercial 37000.00 EUR
    Commercial - Commercial 37000.00 EUR

    Copyright © 2008 ELRA
    ELRACatalogue 0.8.0