Le Web Sémantique et le Traitement Automatique du Langage font couler beaucoup d'encre. Voici, sur ce sujet: les slides (3 Mo) que j'avais présentés à la conférence HEC Web du 24 juin 2008.
L'objectif du Traitement Automatique du Langage est d'insuffler suffisamment d'intelligence à la machine pour qu'elle soit en mesure de "comprendre" le langage humain, et de dialoguer avec l'utilisateur en effectuant des raisonnements. Un jour prochain, ces technologies apporteront une révolution tranquille comparable à celle de l'Internet ou de la téléphonie mobile. D'ici là, plus modestement, ces techniques permettent de mettre en œuvre des moteurs de recherche sémantiques (plus pertinents que Google) et d'améliorer la qualité de la correction grammaticale ou de la traduction automatique.
D’une façon plus novatrice, les gens qui manipulent du texte (cela existe, des professions qui ne croulent pas sous des tonnes de documents ?) peuvent dorénavant automatiser de nombreuses tâches complexes :
- classement thématique des décisions de justice pour des avocats,
- pré analyse de déclaration de sinistres d'assurance,
- orientation des mails entrants vers le bon destinataire,
- génération automatique et sur mesure de réponse à des mails,
- recherche du degré d'originalité d'un brevet,
- présélection des bons candidats pour un recrutement,
- création d'un univers en 3D à partir d'un script ou d'un scénario,
- recherche d'informations ciblées sur un concurrent, en veille économique,
- dialogue avec un avatar virtuel, pour aider l’internaute à choisir le bon produit,
- analyse des blogs pour en détecter l'humeur et cibler des actions marketing...
Ma contribution directe est la plateforme de traitement linguistique la plus aboutie pour .NET, le framework sémantique Antelope (téléchargeable sur www.proxem.com). Cette plateforme fonctionne pour l’anglais et (progressivement) le français ; elle est peut-être un peu aride pour un non-linguiste. Cette nouvelle aventure promet d’être passionnante…