Séminaire : Traduction neuronale massivement multilingue
Listen now
Description
Collège de France Benoît Sagot Informatique et sciences numériques (2023-2024) Année 2023-2024 Séminaire : Traduction neuronale massivement multilingue Intervenant : François Yvon, directeur de recherche CNRS Résumé Le développement d'architectures exploitant les méthodes d'apprentissage neuronal « profond » en traduction automatique a conduit à une augmentation considérable de l'acceptabilité et de l'utilisabilité des traductions calculées par la machine. Ces nouvelles architectures ont également permis de mettre en œuvre des dispositifs de traduction automatique dépassant le cadre habituel de la traduction d'un texte en langue source vers un texte en langue cible : traduction directe de parole, traduction conjointe de texte et d'image, etc. Dans cet exposé, je présenterai un de ces dispositifs, destiné à traduire depuis de multiples langues sources vers de multiples langues sources, en soulignant sur les bénéfices computationnels et linguistiques qu'apportent ces systèmes de traduction multilingues, en particulier pour traduire depuis et vers des langues minoritaires. François Yvon est directeur de recherche au CNRS et exerce ses fonctions dans l'équipe MLIA de l'Institut des Systèmes Intelligents et de Robotique (ISIR/CNRS et Sorbonne Université depuis juillet 2023. Titulaire d'un doctorat en informatique de l'ENST (1996), il y est recruté comme maître de conférences au sein du département Informatique et réseaux, puis est nommé professeur d'informatique à l'université Paris-Sud en 2007. Il intègre à cette occasion le LIMSI-CNRS à Orsay et y développe les activités de traduction automatique au sein de l'équipe « Traitement du Language Parlé ». Il rejoint le CNRS durant son mandat de directeur du LIMSI (2013-2019). Ses activités de recherche couvrent un large spectre de thématiques en traitement automatique des langues, depuis la morphologie computationnelle jusqu'à la fouille de textes et les méthodes d'apprentissage structuré. Durant ces dernières années, l'accent a été mis sur les traitements multilingues : traduction automatique et alignements, apprentissage par transfert interlingue, étude des grands modèles de langue massivement multilingues.
More Episodes
Collège de France Benoît Sagot Informatique et sciences numériques (2023-2024) Année 2023-2024 Séminaire : L'IA axée sur les objectifs : vers des machines capables d'apprendre, de raisonner et de planifier Intervenant : Yann LeCun, Professeur invité, Collège de France, Chief AI Scientist, Meta,...
Published 02/09/24
Collège de France Benoît Sagot Informatique et sciences numériques (2023-2024) Année 2023-2024 08 - Apprendre les langues aux machines : Multimodalités : TAL et images, TAL et parole Résumé Multimodalité : TAL et images, TAL et parole. Améliorer la traduction automatique grâce au contexte,...
Published 02/09/24