Cet atelier, dans la continuité des deux précédents, sera consacré à l'exploration de trois nouveaux outils de transcription :
- Omnilingual ASR, le nouvel modèle de Meta. Apparu en novembre 2025, celui-ci prétend couvrir un espace linguistique beaucoup plus large que les modèles précédents, notamment Whisper. C'est ce que nous vérifierons en analysant des transcriptions automatiques générées à partir de données en Yurakare et en Yucatèque.
- Tactéo, plateforme de transcription et d'annotation collaborative présente dans l'écosystème HumaNum
- Retrac, un outil permettant de convertir facilement en ELAN les transmissions automatiques fournies par Omni ASR ou Whisper
Ateliers du projet ColAnTal : Faire collaborer les anthropologues et les linguistes sur le Traitement Automatique des Langues peu dotées
Lauréat de l’Appel à propositions «Faire à plusieurs, 2025» (MSH Mondes), ce projet propose une exploration des collaborations possibles entre anthropologues et linguistes dans le but d’une mise en commun des données existantes. Cela aura deux résultats concrets : l’amélioration de la visibilité et de la pérennité des données anthropologiques, et l’amélioration de la couverture des langues en TAL.