Retour au reportage Retour au reportage
20230062_0021

© Christian MOREL / LIPN / CNRS Images

Reference

20230062_0021

Traitement automatique des langues

Au second plan, répartition des émotions détectées par rapport aux principaux axes thématiques dans une collection de tweets relatifs aux élections américaines de 2016. Les thématiques ont été identifiés grâce à l'algorithme LDA (Latent Dirichlet Allocation) et les émotions avec un algorithme basé sur SenticNet. Le graphique montre que certains sujets de discussion sont associés à des émotions, souvent négatives. Sur l’écran au premier plan, un exemple d'annotation d'entités du discours scientifique dans des articles académiques. Cette annotation idéale est par contre difficilement obtenable de façon automatique avec les algorithmes de TAL disponibles actuellement. La raison est que la différence entre certains types (comme "Task" et "Method") n'est pas toujours évidente à partir du contexte, mais nécessite une compréhension plus profonde des concepts en question.

CNRS Institute(s)

Regional office(s)

Scientific topics

CNRS Images,

Our work is guided by the way scientists question the world around them and we translate their research into images to help people to understand the world better and to awaken their curiosity and wonderment.