La prochaine séance du séminaire de CLLE-ERSSàB aura lieu le jeudi 6 avril de 15h30 à 17h30 en salle E104.
Nous écouterons un exposé de Bruno Gaume, chercheur au laboratoire CLLE-ERSS (UMR 5263) sur le sujet suivant:
Une métrologie robuste des réseaux lexicaux fondée sur la dynamique des balades aléatoires courtes à travers les relations lexicales
L'intervenant : Bruno Gaume est chercheur au CNRS à CLLE (Cognition, Langues, Langage, Ergonomie), ses travaux de recherche portent sur la compréhension et l'exploitation des propriétés caractéristiques des grands réseaux de terrain et plus particulièrement des réseaux issus de la linguistique, des sciences cognitives et du web. (voir par exemple http://autourdumot.fr/fr.V.causer)
Résumé : Les grands réseaux de terrains sont les réseaux que l'on trouve en pratique, ils sont construits à partir de données issues de différents domaines d'études : La sociologie comme le réseau d'amis de Facebook, la linguistique comme les réseaux de synonymie, la webologie comme le réseau des pages web. Plusieurs études montrent un fait remarquable qui est que tous ces réseaux, pourtant d'origines si diverses, possèdent des propriétés identiques bien particulières et font partie de la classe des Réseaux Petits Mondes Hiérarchiques (RPMH). Un autre fait tout aussi remarquable est que cette classe des RPMH est très petite au regard de l'ensemble des réseaux possibles : la probabilité de tirer au hasard parmi l'ensemble des réseaux possibles un RPMH est très proche de zéro. C'est-à-dire que les réseaux auxquels nous avons à faire dans la vraie vie se ressemblent tous par leurs structures communes, bien qu'intrinsèquement cette structure soit très rare du point de vue de la théorie de la mesure.
L'étude des RPMH mobilisent un grand nombre de chercheurs dans le monde, en effet l'étude et la modélisation des RPMH restent un champ de recherche ouvert et très prometteur pour une meilleure compréhension des phénomènes sous-jacents et pour une meilleure exploitation des données dans de nombreux domaines.
Dans cet exposé seront présentées d'abord les quatre propriétés fondamentales omniprésentes dans les réseaux lexicaux.
Il sera ensuite question de la dynamique des trajets d'un marcheur qui se déplace aléatoirement sur les sommets d'un réseau lexical à travers les relations lexicales. Nous verrons que l'étude de ces dynamiques permet de définir des outils de métrologie lexicale.
Cinq applications de ces métrologies seront proposées:
1) SMAC : Mesurer la similarité structurelle entre réseaux lexicaux [1], [2]
2) WISIGOTH : Enrichissement de lexiques approvisionnés par les foules [3]
3) SLAM : Substitution lexicale en contexte [4] [5]
4) KODEX : Une méthode de categoristaion thematique des resultats d'un moteur de recherche [6]
5) SKILLEX : Une modélisation de la dynamique d'acquisition du lexique par les jeunes enfants [7], [8], [9]
[1] Gaume, B., Navarro, Desalle, Y. and Gaillard, B. (2014) Mesurer la similarité structurelle entre réseaux lexicaux : Proceedings of TALN-20 2014 : Atelier RLTLN, Réseaux Lexicaux et Traitement des Langues Naturelles.
[2] Gaillard, B., Gaume, B., Navarro, E. (2011) Invariants and variability of synonymy networks: Self mediated agreement by confluence : Proceedings of the TextGraphs-6 2011 : Graph-based Methods for Natural Language Processing.
[3] Sajous F, Navarro E, Gaume B, Prévot L,Chudy Y (2010) Semi-automatic Endogenous Enrichment of Collaboratively Constructed Lexical Resources: Piggybacking onto Wiktionary. In Advances in Natural Language Processing, Lecture Notes in Computer Science vol. 6233, pp. 332--344.
[4] Desalle, Y , Gaume B, Duvignau K. (2009) SLAM : Solution Lexicale Automatique pour Métaphore. In revue TAL 2009 vol 50 num1.
[5] Desalle, Y., Navarro, E., Chudy, Y., Magistry, P., Gaume, B. (2014) BACANAL : Balades Aléatoires Courtes pour ANAlyses Lexicales, Application à la substitution lexicale : Proceedings of TALN-20 2014 : Atelier SEMDIS.
[6] Navarro E., Chudy Y., Gaume B., Cabanac G., Pinel-Sauvagnat K. (2011) Kodex ou comment organiser les résultats d’une recherche d’information par détection de communautés sur un graphe biparti ? in Proceedings of the Coria 2011 : Conférence en Recherche d'Information et Applications.
[7] Gaume B., Duvignau K., Prevot L., Desalle Y. (2008) Toward a cognitive organization for electronic dictionaries, the case for semantic proxemy. In GOGALEX Cognitive Aspects of the Lexicon COLLING, Manchester 2008.
[8] Desalle Y, Hsieh S-K, Gaume B, Cheung H (2010) Towards an Automatic Measurement of Verbal Lexicon Acquisition: The Case for a Young Children-versus-Adults Classification in French and Mandarin. In Proceedings of the 2010 PACLIC 24 : Workshop on Model and Measurement of Meaning (M3) pp. 809-818, Tohoku University, Sendai, Japan.
[9] Gaume, B., Duvignau, K., Navarro, E., Desalle, Y., Cheung, H., Hsieh, S.K., Magistry, P., Prévot, L.: Skillex: a graph-based lexical score for measuring the semantic efficiency of used verbs by human subjects describing actions in Journal TAL, volume 55, number 3, Numéro spécial sur Traitement Automatique des Langues et Sciences Cognitives, pp 97--121 (2016)
http://www.atala.org/Skillex-a-graph-based-lexical