L’équipe du projet ColAnTal, lauréat de l’Appel à propositions « Faire à plusieurs, 2025 » de la MSH Mondes, a le plaisir de vous convier à la 1re rencontre entre les membres du Lesc et de Modyco le jeudi 26 juin à 14h au Lesc (bâtiment Ginouvès, 3e étage, salle F308). Cette séance nous permettra d’échanger sur nos méthodes, problématiques, données, besoins et d’étudier les pistes de réflexions à investir.
ColAnTal : Faire collaborer les anthropologues et les linguistes sur le Traitement Automatique des Langues peu dotées
Résumé du projet :
Ce projet se situe à l’intersection du traitement automatique du langage (dorénavant TAL) et de l’anthropologie. Il est motivé par un double constat.
Premièrement, malgré des avancées récentes en TAL, la majorité du patrimoine linguistique du monde en reste exclue : sur quelque 7000 langues recensées, entre 200 et 500 bénéficient des outils les plus récents. Ceci est dû au fait que ces technologies reposent sur des données écrites, le plus souvent récoltées sur Internet. Par conséquent, toute langue ayant une faible présence numérique s’en trouve exclue.
Deuxièmement, les données et archives de l’anthropologie représentent des trésors de données, qui font souvent l’objet d’une numérisation ou documentation partielle, limitant les possibilités de leur utilisation, mais aussi de leur pérennisation et valorisation.
Ce projet propose donc une exploration des collaborations possibles entre ces deux disciplines dans le but d’une mise en commun des données existantes. Cela aura deux résultats concrets : l’amélioration de la visibilité et de la pérennité des données anthropologiques, et l’amélioration de la couverture des langues en TAL.
Ateliers du projet ColAnTal : Faire collaborer les anthropologues et les linguistes sur le Traitement Automatique des Langues peu dotées
Lauréat de l’Appel à propositions « Faire à plusieurs, 2025 » (MSH Mondes), ce projet propose une exploration des collaborations possibles entre anthropologues et linguistes dans le but d’une mise en commun des données existantes. Cela aura deux résultats concrets : l’amélioration de la visibilité et de la pérennité des données anthropologiques, et l’amélioration de la couverture des langues en TAL.