Vous êtes ici :   Accueil
  |  Connexion

Un mot de présentation

Bienvenue sur le site Web de François-Régis Chaumartin (frc AT proxem.com). Ingénieur ENSIIE (1992), et consultant en Systèmes d’Information, j’ai créé en 1994 et dirigé pendant 12 ans Virtutis, une Société de Conseil et de Services en NTIC qui comptait 20 consultants mi-2006. En 2004, j’ai repris le chemin des études (en parallèle à mon activité) en suivant le Master de Recherche de Linguistique Informatique de Laurence Danlos à l'Université Paris 7. Je porte actuellement une casquette de doctorant au laboratoire ALPAGE. Mon projet, ISIDORE (en référence à Isidore de Séville, saint-patron de l'Internet), vise à extraire automatiquement des connaissances d'un corpus encyclopédique. Mon directeur de thèse est Sylvain Kahane. J’enseigne UML et SQL en Master à l’UFR de Linguistique formelle de Paris 7.

Enfin, j'ai créé en 2007 la société Proxem ("PROCédures SEMantiques"), qui propose des solutions de Traitement Automatique du Langage Naturel à destination des entreprises (analyse de feedbacks, e-réputation...), ainsi qu'une plate-forme de traitement linguistique, Antelope (pour l'anglais et le français).

J'ai une (modeste) activité de recherche, avec quelques publications académiques. On trouvera aussi un peu de vulgarisation (au bon sens du mot !) sur ces sujets dans des interviews en vidéo et articles de presse.

Web sémantique et Traitement Automatique du Langage Naturel

Le Web Sémantique et le Traitement Automatique du Langage font couler beaucoup d'encre. Voici, sur ce sujet: les slides (3 Mo) que j'avais présentés à la conférence HEC Web du 24 juin 2008.

L'objectif du Traitement Automatique du Langage est d'insuffler suffisamment d'intelligence à la machine pour qu'elle soit en mesure de "comprendre" le langage humain, et de dialoguer avec l'utilisateur en effectuant des raisonnements. Un jour prochain, ces technologies apporteront une révolution tranquille comparable à celle de l'Internet ou de la téléphonie mobile. D'ici là, plus modestement, ces techniques permettent de mettre en œuvre des moteurs de recherche sémantiques (plus pertinents que Google) et d'améliorer la qualité de la correction grammaticale ou de la traduction automatique.

D’une façon plus novatrice, les gens qui manipulent du texte (cela existe, des professions qui ne croulent pas sous des tonnes de documents ?) peuvent dorénavant automatiser de nombreuses tâches complexes :

  • classement thématique des décisions de justice pour des avocats,
  • pré analyse de déclaration de sinistres d'assurance,
  • orientation des mails entrants vers le bon destinataire,
  • génération automatique et sur mesure de réponse à des mails,
  • recherche du degré d'originalité d'un brevet,
  • présélection des bons candidats pour un recrutement,
  • création d'un univers en 3D à partir d'un script ou d'un scénario,
  • recherche d'informations ciblées sur un concurrent, en veille économique,
  • dialogue avec un avatar virtuel, pour aider l’internaute à choisir le bon produit,
  • analyse des blogs pour en détecter l'humeur et cibler des actions marketing...

Ma contribution directe est la plateforme de traitement linguistique la plus aboutie pour .NET, le framework sémantique Antelope (téléchargeable sur www.proxem.com). Cette plateforme fonctionne pour l’anglais et (progressivement) le français ; elle est peut-être un peu aride pour un non-linguiste. Cette nouvelle aventure promet d’être passionnante…