Projets

Responsable de projets

NaijaSynCor (Macrosyntactic Annotation for Nigerian Pidgin)
Projet soutenu par l’ANR, période 2017-2020 (4 ans), responsable Bernard Caron
Responsable annotation syntaxique : Sylvain Kahane
Objectif : constitution et annotation syntaxique et prosodique d’un corpus de 500 000 mots pour le naija, un créole de l’anglais parlé par 80M de personnes au Nigéria

Orféo (Outillage d’un corpus de référence pour le français écrit et oral)

Projet soutenu par l’ANR, période 2013-2017 (4 ans), responsable Jeanne-Marie Debaisieux
Responsable annotation syntaxique : Sylvain Kahane
Objectif : développement d’un treebank syntaxique de 10M de mots, dont 4M d’oral, et d’une plateforme d’interrogation

Rhapsodie (Annotation prosodique et syntaxique d’un corpus de français parlé)
Projet soutenu par l’ANR, période 2008-2012 (4 ans 1/2), responsable du projet Anne Lacheret
Responsable annotation syntaxique : Sylvain Kahane
Objectif : développement d’un treebak de référence pour le français parlé de 3h (33 000 mots), échantillon de 5-10 minutes, annotation des proéminences intonatives, annotation microsyntaxique (analyse en dépendance) et macrosyntaxique

LexSynt (Lexiques syntaxiques et interface lexique-grammaire)
Projet soutenu par l’ILF période 2005-2008
Objectif : valorisation des lexiques syntaxiques existants pour le français, normalisation, fusion, distribution, interfaçage avec des grammaires formelles

Dicouebe : réalisation d’un dictionnaire de cooccurence en ligne à partir des ressources développées par Alain Polguère et Igor Mel’cuk à l’Université de Montréal (OLST)
Projet soutenu par la chaire Blaise Pascal attribuée à Igor Mel’cuk en 2002-2004

Participation à des projets

Mosaïque
ARC INRIA dirigée par Lionel Clément (Signes, Bordeaux), période 2006-2008
Objectif : étudier l’articulation entre des modèles syntaxiques de haut niveau, reflétant les théories linguistiques, et des formalismes plus opérationnels pour le TAL.

Synta-que
Projet ILF dirigé par Pierre Le Goffic (Lattice), période 2002-2004
Objectif : réalisation d’un corpus richement étiqueté pour les mots en qu.

GenI 
ARC INRIA dirigée par Claire Gardent (LORIA, Nancy), période 2001-2003
Objectif : lier génération de texte et inférence logique.