Le projet de recherche Concordance : étayer la connaissance de la langue tahitienne écrite sur un corpus de textes laïcs du XIX° et XX° siècle.

Recherche Bibliothèques Numérique , Recherche
Le projet de recherche Concordance est lauréat de l’appel à projet Numérisation 2018 de l’infrastructure de recherche CollEx Persée.

Les partenariats Recherche-Bibliothèque : de belles réussites ! 

Un vaste patenariat initié par le laboratoire EASTCO donne lieu à des travaux de recherche à haute valeur ajoutée sur la base des corpus écrits numérisés, dont la création et l'enrichissement du Dictionnaire en ligne de l’Académie Tahitienne grâce à la bibliothèque numérique Ana’ ite. Ce succès s'appuie sur des corpus numérisés localement et inscrit la recherche à l'UPF dans la politique nationale de numérisation et dans les mouvements internationaux des Humanités Numériques et des Archives ouvertes.

Le projet Concordance : transcrire des périodiques tahitiens du XIX° et XX° siècles

Porté par le laboratoire EASTCO, la Bibliothèque Universitaire, la Maison des Sciences de l'Homme du Pacifique, le Service du Patrimoine Archivistique et Audiovisuel de la Polynésie française (SPAA) et Tahiti ingénierie, le projet Concordance vise à étayer la recherche lexicographique sur la langue tahitienne à partir d’un vaste corpus de textes écrits authentiques et diversifiés, libres de droit, en permettant l’interopérabilité entre la Bibliothèque scientifique numérique polynésienne Ana’ite et le Dictionnaire tahitien-français en ligne de l’Académie tahitienne. Il s’agit de permettre aux utilisateurs du dictionnaire en ligne, en partant d’un mot, de visualiser un répertoire d’occurrences de ce mot issu d’un corpus de textes tahitiens déposé sur Ana’ite. 

Le projet Concordance est financé par l’Université de Polynésie Française, la MSH Pacifique et l’Appel à projet Numérisation 2018 de l’infrastructure de recherche CollEx Persée.

Takurua Parent, étudiante en Master Langues et Civilisations des Sociétés Océaniennes (LCSO) a été recrutée pour transcrire les textes du corpus. 

 

lequipe_concordance_0.jpg

L’équipe du projet Concordance dans les locaux de la Bibliothèque universitaire de la Polynésie Française. Crédit Photo P. Albert.

Pour en savoir plus

Les premiers travaux lexicographiques engagés par les missionnaires au XIXè siècle se sont prolongés jusqu’à l’époque contemporaine avec le dictionnaire de l’Académie tahitienne. Cependant, les écrits de référence pour l’exemplification du vocabulaire tahitien sont encore peu diversifiés (recueils de tradition orale et textes religieux). Le corpus cible du projet permet d’élargir à des sources laïques et modernes le périmètre d’étude. Le projet a pour ambition de rendre ce corpus plus manipulable en réalisant une double transcription des textes. Des locuteurs-scripteurs experts du tahitien en établiront une première version exactement conforme aux originaux et une deuxième version conforme à la graphie officielle contemporaine fixée par l’Académie tahitienne. Cette normalisation du corpus permettra ensuite d’établir les fonctions de concordance, autrement dit l’interopérabilité entre Ana’ite et le dictionnaire tahitien-français en ligne de l’Académie tahitienne.



Les utilisateurs du dictionnaire, en partant d’une entrée lexicale, pourront visualiser un répertoire d’occurrences issu du corpus. Le projet contribue ainsi à enrichir le dictionnaire avec de nombreux exemples issus d’une langue écrite authentique, quotidienne, normée.

 

Le corpus cible du projet Concordance est constitué des numéros de trois périodiques du 19e et du 20e siècles en langue tahitienne :

-       Te Vea no Tahiti, hebdomadaire, premier journal en langue tahitienne sous l’administration coloniale  française, 62 numéros, 2 p., 33 cm, de 1852 à 1853 ;

-       Te Vea Maohi, mensuel créé par le gouverneur Bouge, 11 numéros, 8 à 16 p., 32 cm, de 1937 à 1941

-       Torea, mensuel privé d’informations générales et locales, 30 numéros, 12 à 16 p., 25 cm, de 1937 à 1939

L’ensemble du corpus représente une volumétrie d’environ 700 pages et 434 000 mots.

Sources 

Projet Concordance présenté sur le site TACT