Retour au reportage Retour au reportage
20230062_0022

© Christian MOREL / LIPN / CNRS Images

Référence

20230062_0022

Traitement automatique des langues

Au second plan, répartition des émotions détectées par rapport aux principaux axes thématiques dans une collection de tweets relatifs aux élections américaines de 2016. Les thématiques ont été identifiés grâce à l'algorithme LDA (Latent Dirichlet Allocation) et les émotions avec un algorithme basé sur SenticNet. Le graphique montre que certains sujets de discussion sont associés à des émotions, souvent négatives. Sur l’écran au premier plan, un exemple d'annotation d'entités du discours scientifique dans des articles académiques. Cette annotation idéale est par contre difficilement obtenable de façon automatique avec les algorithmes de TAL disponibles actuellement. La raison est que la différence entre certains types (comme "Task" et "Method") n'est pas toujours évidente à partir du contexte, mais nécessite une compréhension plus profonde des concepts en question.

Institut(s)

Délégation(s)

Thématiques scientifiques

CNRS Images,

Nous mettons en images les recherches scientifiques pour contribuer à une meilleure compréhension du monde, éveiller la curiosité et susciter l'émerveillement de tous.