Séminaire : Quelques exemples d'application du TAL aux humanités numériques
Listen now
Description
Collège de France Benoît Sagot Informatique et sciences numériques (2023-2024) Année 2023-2024 Séminaire : Quelques exemples d'application du TAL aux humanités numériques Intervenants : Daniel Stoekl Ben Ezra, directeur d'études, EPHE-PSL Jean-Baptiste Camps, maître de conférences, École nationale des chartes, Université PS Résumé Traitement automatique des langues et sciences humaines computationnelles : l'intelligence artificielle au service du passé Cette intervention présentera des cas d'usage de méthodes relevant du traitement automatique des langues en sciences humaines, et particulièrement dans les sciences des textes et la philologie des textes anciens et médiévaux en français et en hébreu. Nous commencerons par l'utilisation de techniques d'alignement texte/image qui facilitent la création supervisée de données de vérité de terrain pour la transcription automatique d'écritures manuscrites, aident à la résolution des abréviations et la reconstitution des copies d'un même texte. Nous continuerons avec les défis posés par la normalisation ou la lemmatisation d'états anciens de langue, présentant une variation graphique importante, tout en montrant comment cela peut servir ensuite pour la détection de l'intertextualité ou bien encore, à l'utilisation de méthodes de stylométrie pour l'identification des auteurs de textes anonymes ou disputés. Enfin, nous montrerons comment le traitement automatique des langues et l'intelligence artificielle peuvent être mis au service de la constitution et l'analyse de vastes corpus en diachronie longue, et comment ceux-ci peuvent être ensuite analysés en ayant recours à des méthodes telles que les plongements de mots et documents (embeddings) ou les grands modèles de langue pour ensuivre dans le temps les grandes évolutions thématiques. Daniel Stoekl Ben Ezra Daniel Stoekl Ben Ezra (PhD, Jérusalem, 2001) est directeur d'études sur la chaire Langue, littérature, épigraphie et paléographie hébraïque et araméenne (IVe siècle av. – IVe siècle apr. J.-C.) à l'EPHE, PSL et membre du laboratoire AOrOc (UMR 8546, PSL-CNRS). Ses recherches portent sur les manuscrits de la mer Morte, la littérature rabbinique ancienne et les humanités numériques. Ses publications imprimées incluent Diversity and Rabbinization (avec G. McDowell et R. Naiweld, Cambridge 2019), Scriptures, Sacred Traditions and Strategies of Religious Subversion (avec M. Blidstein et S. Ruzer, Tübingen 2018), Qumran (Stuttgart/Tübingen 2016), L'Identité à travers l'éthique (avec K. Berthelot et R. Naiweld, Leiden 2015), Mischna Bikkurim (Jerusalem 2011), Aramaica Qumranica (avec K. Berthelot, Leiden 2008) et The Impact of Judaism on Ancient Christianity (Tübingen 2003). Ses publications électroniques incluent la base de données THALES, THesaurus Antiquorum Lectionariorum Ecclesiae Synagogaeque, et l'édition numérique de la Mishna (codirigé avec H. Lapin) avec une traduction française en cours (codirigée avec R. Naiweld et L. Vana) ainsi que la plateforme open-source eScriptorium pour la transcription automatique de manuscrits (avec P. Stokes, M. Bui, B. Kiessling et R. Tissot). Depuis octobre 2023, il est communicating PI du projet ERC Synergy MiDRASH. Jean-Baptiste Camps Jean-Baptiste Camps est maître de conférences en philologie computationnelle à l'École nationale des chartes, PSL. Il y dirige le master Humanités numériques de PSL, après avoir dirigé le master Technologies numériques appliquées à l'histoire (de 2013 à 2017). Ses recherches portent sur l'analyse de données textuelles et l'intelligence artificielle appliquées aux textes historiques. Il s'intéresse tout particulièrement à la littérature médiévale, notamment aux textes épiques et lyriques de langue d'oïl et d'oc. Ses recherches en stylométrie ont été récompensées en 2019 par le prix Fortier 2019 de la Digital Humanities Conference (en collaboration ave
More Episodes
Collège de France Benoît Sagot Informatique et sciences numériques (2023-2024) Année 2023-2024 Séminaire : L'IA axée sur les objectifs : vers des machines capables d'apprendre, de raisonner et de planifier Intervenant : Yann LeCun, Professeur invité, Collège de France, Chief AI Scientist, Meta,...
Published 02/09/24
Collège de France Benoît Sagot Informatique et sciences numériques (2023-2024) Année 2023-2024 08 - Apprendre les langues aux machines : Multimodalités : TAL et images, TAL et parole Résumé Multimodalité : TAL et images, TAL et parole. Améliorer la traduction automatique grâce au contexte,...
Published 02/09/24