Course Details

Course Name
Lexicographie, terminographie et traitement automatique des corpus
Course Type
Master Programme
Institution
Université Lille 3
Department
Sciences du langage
Information
https://www.univ-lille3.fr/ufr-humanites/sciences-langage/formations/masters/lttac/
Curriculum
-
Status
record actively maintained
Course Language
French
Start Date
2000-09-01
recurring
ECTS
120
Lecturer
Nathalie Gasiglia
PID
Disciplines: Human Language Technologies, Linguistics and Language Studies
Techniques: Encoding, Named Entity Recognition, Pattern Recognition, POS-Tagging, Text Mining
Objects: Data, Language, Literature, Multimedia, Multimodal, NamedEntities, Text, Speech
Access Requirements
- La formation s’adresse en priorité aux candidat-e-s pouvant justifier d’une licence mention Sciences du langage, mention LLCER, mention Arts, mention Informatique, mention Histoire, mention Lettres ou mention Philosophie. - Elle est également ouverte aux candidats/candidates dans le cadre de la validation des acquis de l’expérience (VAE) et de la formation tout au long de la vie (FTLV).
Description
Le Master Sciences du langage parcours Lexicographie, Terminographie, et Traitement Automatique des Corpus (LTTAC) vous permet de travailler dans les domaines de la lexicographie, de la terminographie, des industries de la langue et des Nouvelles Technologies de L’Information et de la Communication. Dans le cadre de votre activité, vous pourrez être amené à : - Participer à la rédaction de dictionnaires monolingues et bilingues et d’encyclopédies onnaître le langage de structuration de documents XML et les langages associés (xPath, XSLT, etc.) - Concevoir de bases de données pour la lexicographie et la terminologie - Développer des lexiques pour des systèmes d’aide à la rédaction ou de traduction automatique ou assistée - Élaborer des catalogues et des guides thématiques - Construire des ontologies pour le traitement automatique des langues et l’intelligence artificielle - Intégrer des ressources lexicales à des moteurs de recherche et autres outils d’extraction d’informations ou d’indexation automatique de documents - Mener des recherches en linguistique fondamentale ou appliquée - Développer des produits multimédias ou des outils pour la didactique des langues. COMPÉTENCES VISÉES - Utiliser la linguistique fondamentale pour répondre aux besoins des traitements pratiques du lexique - Connaître une ou plusieurs langues vivantes - Connaître l’activité et les pratiques lexicographiques - Connaître les domaines du traitement automatique des langues (TAL) - Manier des ressources et outils informatiques pertinents pour l’ensemble des applications concernées par les analyses linguistiques et le traitement du lexique - Posséder des notions en conception de bases de données SQL - Savoir programmer en JavaScript et en Perl - Manipuler de façon basique des logiciels de transcription alignée aux sons ou aux vidéos, des outils d’indexation automatique de documents, des étiqueteurs morphosyntaxiques, des systèmes d’alignement de corpus multilingues, des concordanciers, des outils de fouille de textes et d’extraction d’informations, des mémoires de traduction - Posséder des notions en conception d’ontologies - Comprendre le fonctionnement des dictionnaires électroniques - Rédiger des descriptions lexicales destinées à des lecteurs humains ou dédiées à des applications informatiques ORGANISATION DE LA FORMATION MASTER 1, semestres 1 et 2, 60 ECTS Linguistique (48H - 6 ECTS) - Théories linguistiques 1 et 2 - Initiation à des outils logiciels Lexicographie et terminographie (120H - 12 ECTS) - Analyse de l'offre dictionnairique 1 - Analyses structurelles des dictionnaires 1 - Lexicographie bilingue et linguistique contrastive 1 - Rédaction d'articles selon un projet éditorial 1 TAC et TAL (102H - 12 ECTS) - Algorithmique - Programmation pour l'extraction d'informations (Perl) - Ressources et outils informatiques pour la linguistique - Activités du TAL Informatique éditoriale (gestion de flux XML) (48H - 6 ECTS) - Xmlisation des documents bruts ou stylés et XSLT pour l'édition en HTML Professionnalisation (16 H - 6 ECTS) - Gestion de projets lexicographiques, éditoriaux ou talistes 1 - Stage de Master 1 Initiation à la recherche - Mémoire (6 ECTS) Langue vivante - Anglais (41H - 6 ECTS) Spécialisation (154H - 6 ECTS) MASTER 2 - semestres 3 et 4, 60 ECTS Linguistique (48H - 6 ECTS) - Théories linguistiques 3 - Linguistique et traitement automatique de corpus Lexicographie et terminographie (168H - 18 ECTS) - Analyse de l'offre dictionnairique 2 - Analyses structurelles des dictionnaires 2 - Lexicographie bilingue et linguistique contrastive 2 - Rédaction d'articles selon un projet éditorial 2 - Lexicographie électronique 1 et 2 TAC et TAL (84H - 12 ECTS) - Bases de données et corpus - Programmation pour l'extraction d'nformations (JavaScript) - Programmation pour l'enrichissement de corpus Informatique éditoriale (gestion de flux XML) (54H - 6 ECTS) - Enrichissements xmlisés de textes - Connaissance de la chaîne éditoriale électronique - Éditions multisupports (PDF InDesign et ePub) de textes xmlisés - Éthique des éditions électroniques ou bimédia Professionnalisation (16 H - 6 ECTS) - Gestion de projets lexicographiques, éditoriaux ou talistes 2 - Stage de Master 2 Initiation à la recherche - Mémoire (6 ECTS) Langue vivante - Anglais (31H - 6 ECTS) INSERTION PROFESSIONNELLE ET POURSUITE D'ÉTUDES Secteurs d'activité : - Édtion spécialisée (secteurs des dictionnaires, de la jeunesse, des guides, etc.) - Entreprises de prépresse (pour mettre en page les livres imprimés et électroniques) - Agences de traduction de logiciels, de didacticiels, de jeux pour développer des lexiques spécialisés - Industries de la langue développant des applications et logiciels à composante linguistique - Entreprises industrielles ou commerciales Métiers visés : Lexicographe, chef de projets lexicaux, terminologue, traducteur - terminologue, rédacteur des guides pratiques et de catalogues techniques ou commerciaux, informaticien éditorial
Keywords
Disciplines: Human Language Technologies, Linguistics and Language Studies
Techniques: Encoding, Named Entity Recognition, Pattern Recognition, POS-Tagging, Text Mining
Objects: Data, Language, Literature, Multimedia, Multimodal, NamedEntities, Text, Speech