approche cognitive pour la desambiguïsation d'entites emergentes dans les articles d'actualite
Ecole Superieure Polytechnique D’Antananarivo - nan - None ()
Resume
la désambiguïsation dentités nommées sinscrit dans le domaine du traitement automatique du langage naturel dans le contexte de lexploration de données. reposant presque exclusivement sur des approches empiriques, les méthodes existantes sont performantes sur les entités populaires. toutefois, face aux entités émergentes ou à des noms de faible notoriété, elles présentent des défaillances. nous proposons une approche cognitive basée sur lutilisation dune grammaire formelle utilisée conjointement avec un arbre-modèle de régression logistique pour la désambiguïsation dentités nommées. lobjectif principal est déviter lexclusion dentités émergentes qui sont difficilement reconnaissables par voie empirique sans pour autant désavantager les entités populaires. nous avons choisi comme champ dexpérimentation les articles dactualité, lesquels non seulement produisent massivement des entités émergentes, mais se prêtent en plus fort bien, du fait de leur qualité aussi bien syntaxique que sémantique à la formalisation. ce projet qui est né dans le contexte du projet originel aida se voit ainsi attribuer lappellation aida-for-news.