Projects

Responsable de projets – Project manager

Autogramm (Automatic induction of descriptive grammars from syntactic treebanks)
Projet soutenu par l’ANR, période 2022-2025 (4 ans), 525k€
Responsable du projet : Sylvain Kahane
Objectif: développement conjoint de corpus annotés en syntaxe et de grammaire, extraction de grammaires quantitatives dont les règles sont classées par ordre d’importance, typologie quantitative

NaijaSynCor (Macrosyntactic Annotation for Nigerian Pidgin)
Projet soutenu par l’ANR, période 2017-2021 (4 ans), responsable Bernard Caron
Responsable partenaire Modyco : Sylvain Kahane
Objectif : constitution et annotation syntaxique et prosodique d’un corpus de 500 000 mots pour le naija, un créole de l’anglais parlé par 80M de personnes au Nigéria

Orféo (Outillage d’un corpus de référence pour le français écrit et oral)
Projet soutenu par l’ANR, période 2013-2017 (4 ans), responsable Jeanne-Marie Debaisieux
Responsable partenaire Modyco : Sylvain Kahane
Objectif : développement d’un treebank syntaxique de 10M de mots, dont 4M d’oral, et d’une plateforme d’interrogation

Rhapsodie (Annotation prosodique et syntaxique d’un corpus de français parlé)
Projet soutenu par l’ANR, période 2008-2012 (4 ans 1/2), responsable du projet Anne Lacheret (Modyco)
Responsable annotation syntaxique : Sylvain Kahane
Objectif : développement d’un treebak de référence pour le français parlé de 3h (33 000 mots), échantillon de 5-10 minutes, annotation des proéminences intonatives, annotation microsyntaxique (analyse en dépendance) et macrosyntaxique

LexSynt (Lexiques syntaxiques et interface lexique-grammaire)
Responsable : Sylvain Kahane (Modyco)
Projet soutenu par l’ILF période 2005-2008
Objectif : valorisation des lexiques syntaxiques existants pour le français, normalisation, fusion, distribution, interfaçage avec des grammaires formelles

Dicouebe
Projet soutenu par la chaire Blaise Pascal attribuée à Igor Mel’cuk en 2002-2004
Responsable du projet : Sylvain Kahane
Objectif : réalisation d’un dictionnaire de cooccurence en ligne à partir des ressources développées par Alain Polguère et Igor Mel’cuk à l’Université de Montréal (OLST)

Participation à des projets

Mosaïque
ARC INRIA dirigée par Lionel Clément (Signes, Bordeaux), période 2006-2008
Objectif : étudier l’articulation entre des modèles syntaxiques de haut niveau, reflétant les théories linguistiques, et des formalismes plus opérationnels pour le TAL.

Synta-que
Projet ILF dirigé par Pierre Le Goffic (Lattice), période 2002-2004
Objectif : réalisation d’un corpus richement étiqueté pour les mots en qu.

GenI 
ARC INRIA dirigée par Claire Gardent (LORIA, Nancy), période 2001-2003
Objectif : lier génération de texte et inférence logique.