Nous sommes fiers de figurer dans Nature cette semaine, aux côtés Masakhane comme nous travaillons sur "Décoloniser la science".

Lisez la version de cet article en français sur ecomag.fr/les-langues-africaines-pour-obtenir-plus-de-termes-scientifiques-sur-mesure-ecologie-science/

Beaucoup de mots communs à la science n'ont jamais été écrits dans les langues africaines. Maintenant, des chercheurs de toute l'Afrique sont en train de changer cela.

Plusieurs élèves-enseignants dans la bibliothèque, cherchant des livres ou étudiant, au Fort Portal Teacher Training College en Ouganda.
Les chercheurs souhaitent développer les termes scientifiques dans les langues africaines, notamment le luganda, parlé en Afrique de l'Est. Sur la photo : des élèves-enseignants à Kampala. Crédit : Eye Ubiquitous/Alamy

Il n'y a pas de mot isiZulu original pour dinosaure. Les germes sont appelés amagciwane, mais il n'y a pas de mots séparés pour les virus ou les bactéries. Un quark est ikhwakhi (prononcé kwa-ki) ; il n'y a pas de terme pour le décalage vers le rouge. Et les chercheurs et les communicateurs scientifiques utilisant la langue, qui est parlée par plus de 14 millions de personnes en Afrique australe, ont du mal à s'entendre sur les mots pour l'évolution.

IsiZulu est l'une des quelque 2,000 XNUMX langues parlées en Afrique. La science moderne a ignoré l'écrasante majorité de ces langues, mais maintenant une équipe de chercheurs d'Afrique veut changer cela.Quel est l'isiZulu pour dinosaure ? Comment la science a négligé les langues africaines

Un projet de recherche appelé Décoloniser la science prévoit de traduire 180 articles scientifiques du serveur de préimpression AfricArXiv dans 6 langues africaines : isiZulu et Northern Sotho d'Afrique australe ; Haoussa et Yoruba d'Afrique de l'Ouest ; et le luganda et l'amharique d'Afrique de l'Est.

Ces langues sont parlées collectivement par environ 98 millions de personnes. Plus tôt ce mois-ci, AfricArXiv appel à soumissions d'auteurs intéressés à ce que leurs articles soient pris en compte pour la traduction. La date limite est le 20 août.

Les articles traduits couvriront de nombreuses disciplines des sciences, de la technologie, de l'ingénierie et des mathématiques. Le projet est soutenu par le Fonds Lacuna, un bailleur de fonds en science des données pour les chercheurs des pays à revenu faible et intermédiaire. Il a été lancé il y a un an par des bailleurs de fonds philanthropiques et gouvernementaux d'Europe et d'Amérique du Nord, ainsi que par Google.

Langues laissées pour compte

L'absence de termes scientifiques dans les langues africaines a des conséquences concrètes, notamment dans le domaine de l'éducation. En Afrique du Sud, par exemple, moins de 10 % des citoyens parlent l'anglais comme langue maternelle, mais c'est la principale langue d'enseignement dans les écoles, ce qui, selon les universitaires, est un obstacle à l'apprentissage des sciences et des mathématiques.

Les langues africaines sont laissées pour compte dans la révolution en ligne, explique Kathleen Siminyu, spécialiste de l'apprentissage automatique et du traitement du langage naturel pour les langues africaines basée au Kenya. « Les langues africaines sont considérées comme quelque chose que vous parlez à la maison, pas en classe, ne pas apparaître dans le cadre des affaires. C'est la même chose pour la science », dit-elle.

Siminyu fait partie de Masakhane, une organisation de base de chercheurs intéressés par le traitement du langage naturel dans les langues africaines. Masakhane, qui signifie « nous construisons ensemble » en isiZulu, compte plus de 400 membres d'environ 30 pays du continent. Ils travaillent ensemble depuis trois ans.

Le projet Decolonise Science est l'une des nombreuses initiatives que le groupe entreprend ; d'autres incluent la détection des discours de haine au Nigeria et l'enseignement d'algorithmes d'apprentissage automatique pour reconnaître les noms et les lieux africains.

À terme, Decolonise Science vise à créer des glossaires en ligne de termes scientifiques disponibles gratuitement dans les six langues, et à les utiliser pour former des algorithmes d'apprentissage automatique pour la traduction. Les chercheurs espèrent boucler ce projet d'ici début 2022. Mais il y a une ambition plus large : réduire le risque que ces langues deviennent obsolètes en leur donnant un pied plus fort en ligne.

Création de terminologie

Decolonise Science emploiera des traducteurs pour travailler sur des articles d'AfricArXiv dont le premier auteur est africain, a déclaré la chercheuse principale Jade Abbott, spécialiste de l'apprentissage automatique basée à Johannesburg, en Afrique du Sud. Les mots qui n'ont pas d'équivalent dans la langue cible seront signalés afin que les spécialistes en terminologie et les communicateurs scientifiques puissent développer de nouveaux termes. "Ce n'est pas comme traduire un livre, où les mots pourraient exister", dit Abbott. « C’est un exercice de création de terminologie. »

Mais « nous ne voulons pas inventer un mot complètement nouveau », ajoute Sibusiso Biyela, écrivain chez ScienceLink, une société de communication scientifique basée à Johannesburg et partenaire du projet. "Nous voulons que la personne qui lit cet article ou ce terme comprenne ce que cela signifie la première fois qu'elle le voit."

Biyela, qui écrit sur la science en isiZulu, dérive souvent de nouveaux termes en examinant les racines grecques ou latines de mots scientifiques existants en anglais. Planète, par exemple, vient du grec ancien plantēs, signifiant « errant », parce que les planètes étaient perçues comme se déplaçant dans le ciel nocturne. Dans isiZulu, cela devient umhambi, qui signifie aussi vagabond. Un autre mot pour planète, utilisé dans les dictionnaires scolaires, est umhlaba, ce qui signifie « Terre » ou « monde ». D'autres termes sont descriptifs : pour « fossile », par exemple, Biyela a inventé l'expression amathambo amadala atholakala emhlabathini, ou « vieux ossements trouvés dans le sol ».

Dans certains domaines scientifiques, comme la recherche sur la biodiversité, les chercheurs qui tentent de trouver les bons termes devront puiser dans les sources orales. Lolie Makhubu-Badenhorst, directrice par intérim du Bureau de planification et de développement linguistiques de l'Université du KwaZulu-Natal à Durban, affirme que l'absence d'un mot scientifique dans les ensembles de données écrites ne signifie pas qu'il n'existe pas. « Vous êtes centré sur l'écrit, je suis centré sur l'oral. Les connaissances sont là, mais elles ne sont pas bien documentées », explique Makhubu-Badenhorst, qui ne fait pas partie du projet Decolonise Science.

Les spécialistes en terminologie de Decolonise Science proposeront un cadre pour développer les termes scientifiques isiZulu, explique Biyela. Une fois cela terminé, ils l'appliqueront aux autres langues.

L'équipe proposera ses glossaires en tant qu'outils gratuits pour les journalistes et les communicateurs scientifiques, ainsi que pour les conseils linguistiques nationaux, les universités et les entreprises technologiques, qui proposent de plus en plus de traduction automatisée. « Si vous créez un terme et qu'il n'est pas utilisé par d'autres, il ne va pas s'imprégner dans la langue », explique Biyela.

Une femme fait des copies au centre d'intelligence artificielle de Google à Accra, au Ghana, en Afrique.
Google appelle à l'aide pour améliorer la qualité de ses traductions en langues africaines. Crédit : Cristina Aldehuela/AFP via Getty

Big tech : « nous avons besoin de votre aide »

Les chercheurs de Masakhane affirment que les entreprises technologiques mondiales ont historiquement ignoré les langues africaines, mais ces dernières années, elles ont commencé à financer la recherche dans ce domaine.

"Nous sommes conscients que les milliers de langues africaines sont actuellement sous-représentées dans les logiciels de traduction", a déclaré un porte-parole de Google. Nature. Le géant de la technologie souhaite étendre Google Translate pour inclure davantage de langues africaines, notamment le twi, l'éwé, le baoulé, le bambara, le peul, le kanuri, le krio, l'isoko, le luganda, le sango, le tiv et l'urhobo, ont-ils ajouté. Cependant, il a besoin de « locuteurs de ces langues pour nous aider à améliorer la qualité de nos traductions » afin qu'ils puissent être intégrés dans le service.

« La grande idée est la propriété culturelle de la science », explique Biyela. Lui et Abbott disent qu'il est crucial de décoloniser la science en permettant aux gens de faire des recherches et de parler de la science dans leur propre langue. À l'heure actuelle, il est possible d'utiliser les langues africaines pour parler de politique et de sport, mais pas de science, explique Biyela.

De même, l'anglais est la langue dominante de la gérance et de la conservation de l'environnement - mais à moins que les gens ne comprennent le sens de termes et de concepts spécifiques et puissent en parler dans leur langue maternelle, ils peuvent se sentir déconnectés des efforts du gouvernement pour préserver les écosystèmes et les espèces, explique Bheka Nxele. , gestionnaire de programme pour l'écologie de la restauration, la planification environnementale et la protection du climat dans la municipalité d'eThekwini en Afrique du Sud.

Les chercheurs craignent que si les langues africaines ne sont pas incluses dans les algorithmes en ligne, elles pourraient, à terme, devenir obsolètes et oubliées. « Ce sont des langues que [les gens] parlent. Ce sont des langues qu'ils utilisent tous les jours, et ils vivent avec et voient la réalité qu'en x nombre d'années, leur langue pourrait être morte parce qu'il n'y a pas d'empreinte numérique », explique Siminyu.

doi: https://doi.org/10.1038/d41586-021-02218-x


0 Commentaires

Laissez un commentaire