Episodes
Collège de France
Benoît Sagot
Informatique et sciences numériques (2023-2024)
Année 2023-2024
Séminaire : L'IA axée sur les objectifs : vers des machines capables d'apprendre, de raisonner et de planifier
Intervenant : Yann LeCun, Professeur invité, Collège de France, Chief AI Scientist, Meta, Professor, NYU
Résumé
Comment les machines pourraient-elles apprendre aussi efficacement que les humains et les animaux ? Comment les machines pourraient-elles apprendre le fonctionnement du monde...
Published 02/09/24
Collège de France
Benoît Sagot
Informatique et sciences numériques (2023-2024)
Année 2023-2024
08 - Apprendre les langues aux machines : Multimodalités : TAL et images, TAL et parole
Résumé
Multimodalité : TAL et images, TAL et parole. Améliorer la traduction automatique grâce au contexte, notamment aux images. Le TAL sans l'écrit : réconcilier TAL et traitement de la parole, avec l'exemple de la traduction automatique de la parole.
Published 02/09/24
Collège de France
Benoît Sagot
Informatique et sciences numériques (2023-2024)
Année 2023-2024
Séminaire : Prédire c'est comprendre : un modèle neuro-cognitif du langage fondé sur la prédiction
Intervenant : Philippe Blache, directeur de recherche CNRS
Résumé
La compréhension mutuelle pendant une conversation est un processus extrêmement rapide et efficace : nous pouvons traiter trois mots par seconde, souvent plus. Cette observation n'est cependant pas conforme aux expériences de...
Published 02/02/24
Collège de France
Benoît Sagot
Informatique et sciences numériques (2023-2024)
Année 2023-2024
07 - Apprendre les langues aux machines : Converser avec la machine
Résumé
Agents conversationnels, chatbots et « large language models » conversationnels : d'Eliza à ChatGPT et ChatLLAMA. Comment les très grands modèles conversationnels ont-ils été entraînés ? Quelles limites, quels enjeux éthiques, quelles utilisations, quel avenir ?
Published 02/02/24
Collège de France
Benoît Sagot
Informatique et sciences numériques (2023-2024)
Année 2023-2024
Séminaire : Analyse automatique de l'argumentation dans les débats politiques
Intervenant : Elena Cabrio, professeur des Universités, université Côte-d'Azur, Inria, CNRS, I3S, France
Résumé
Les débats politiques offrent aux citoyens une occasion unique d'apprécier la position des représentants politiques sur les sujets les plus controversés de l'actualité. Au regard des prises actives de paroles...
Published 01/26/24
Collège de France
Benoît Sagot
Informatique et sciences numériques (2023-2024)
Année 2023-2024
06 - Apprendre les langues aux machines : Linguistique computationnelle
Résumé
Le TAL au service de la linguistique, avec un bref détour par les applications du TAL au service des humanités et sciences sociales. La linguistique comme domaine d'application du TAL, en trois exemples : morphologie computationnelle et complexité morphologique ; approches informatiques de la linguistique historique et...
Published 01/26/24
Collège de France
Benoît Sagot
Informatique et sciences numériques (2023-2024)
Année 2023-2024
Séminaire : Génération de texte à partir de connaissances
Intervenant :
Claire Gardent, directrice de recherche CNRS
Résumé
La génération de texte peut cibler différents types de langues et prendre en entrée différents types de connaissances. Dans cette présentation, je montrerai comment adapter les modèles de langue neuronaux pour générer du texte à partir de graphes de représentation...
Published 01/19/24
Collège de France
Benoît Sagot
Informatique et sciences numériques (2023-2024)
Année 2023-2024
05 - Apprendre les langues aux machines : Approches neuronales pour quelques tâches applicatives
Résumé
Quelques autres tâches aval : reconnaissance d'entités nommées ; analyse syntaxique ; la classification de phrases : approches classiques, embeddings de phrases ; la simplification de textes.
Published 01/19/24
Collège de France
Benoît Sagot
Informatique et sciences numériques (2023-2024)
Année 2023-2024
Séminaire : Traduction neuronale massivement multilingue
Intervenant :
François Yvon, directeur de recherche CNRS
Résumé
Le développement d'architectures exploitant les méthodes d'apprentissage neuronal « profond » en traduction automatique a conduit à une augmentation considérable de l'acceptabilité et de l'utilisabilité des traductions calculées par la machine. Ces nouvelles architectures ont...
Published 01/12/24
Collège de France
Benoît Sagot
Informatique et sciences numériques (2023-2024)
Année 2023-2024
04 - Apprendre les langues aux machines : Traduction automatique
Résumé
Histoire de la discipline, approches récentes. Enjeux actuels : couvrir les langues moins dotées ; prendre en compte le contexte ; être robuste à la variation linguistique.
Published 01/12/24
Collège de France
Benoît Sagot
Informatique et sciences numériques (2023-2024)
Année 2023-2024
Séminaire : Apprendre un modèle de langue à partir de l'audio
Intervenant :
Emmanuel Dupoux, directeur d'études EHESS, chercheur META
Résumé
La modalité orale est le canal le plus naturel pour les interactions linguistiques, mais les technologies langagières actuelles (TAL) se basent surtout sur l'écrit, nécessitant de grandes quantités de textes pour développer des modèles de langage. Même les...
Published 12/28/23
Collège de France
Benoît Sagot
Informatique et sciences numériques (2023-2024)
Année 2023-2024
03 - Apprendre les langues aux machines : Modèles de langue
Résumé
Les modèles de langue, une direction de recherche indépendante de la représentation vectorielle pendant l'ère préneuronale. Leur évolution récente et leur rencontre, jusqu'aux modèles de langue contextuels neuronaux. Les architectures récurrentes (y compris les LSTM) et l'architecture Transformer. Les modèles de langues neuronaux...
Published 12/22/23
Collège de France
Benoît Sagot
Informatique et sciences numériques (2023-2024)
Année 2023-2024
Séminaire : Deux exemples d'usage des transducteurs en linguistique
Intervenant :
Guillaume Jacques, directeur de recherche, CNRS, directeur d'étude, EPHE
Résumé
Les transducteurs sont un outil précieux pour plusieurs domaines distincts de la linguistique. En morphologie, ils permettent de produire des descriptions explicites et cohérentes des paradigmes morphologiques, aussi bien pour les...
Published 12/15/23
Collège de France
Benoît Sagot
Informatique et sciences numériques (2023-2024)
Année 2023-2024
02 - Apprendre les langues aux machines : Approches symboliques et probabilistes
Résumé
L'étiquetage en parties du discours (des n-grams à la régression logistique) et la lemmatisation. Présentation de certaines classes de grammaires faiblement contextuelles pour la modélisation et l'analyse syntaxiques. Algorithmes d'analyse syntaxique pour le TAL. Interaction avec l'analyse de surface, y...
Published 12/15/23
Collège de France
Benoît Sagot
Informatique et sciences numériques (2023-2024)
Année 2023-2024
Séminaire : Quelques exemples d'application du TAL aux humanités numériques
Intervenants :
Daniel Stoekl Ben Ezra, directeur d'études, EPHE-PSL
Jean-Baptiste Camps, maître de conférences, École nationale des chartes, Université PS
Résumé
Traitement automatique des langues et sciences humaines computationnelles : l'intelligence artificielle au service du passé
Cette intervention présentera des...
Published 12/08/23
Collège de France
Benoît Sagot
Informatique et sciences numériques (2023-2024)
Année 2023-2024
01 - Apprendre les langues aux machines : Représenter les unités textuelles
Résumé
Les niveaux d'analyse linguistique. Phrases et mots. La loi de Zipf. Quelles représentations pour les mots (voire les phrases), quelles propriétés pour ces représentations ? Les mots (lexiques, lemmes), leurs représentations sous forme de structures de traits puis de vecteurs (embeddings). Illustration sur la tâche...
Published 12/08/23
Collège de France
Benoît Sagot
Informatique et sciences numériques (2023-2024)
Année 2023-2024
Leçon inaugurale - Benoît Sagot : Apprendre les langues aux machines
Depuis une dizaine d'années, le terme d'« intelligence artificielle » est revenu partout sur le devant de la scène, des magazines grand public aux créateurs de start-up et aux décideurs politiques. Des progrès dans la recherche sur les réseaux de neurones, une technologie pourtant ancienne, mais aussi l'augmentation de la...
Published 11/30/23