Marcher dans deux mondes : comment un informaticien autochtone utilise l’IA pour préserver les langues menacées

Ses collègues décrivent régulièrement Michael Running Wolf comme quelqu’un qui navigue sans problème entre deux mondes.

En tant que chercheur en intelligence artificielle (IA) au sein de l’entreprise de développement de logiciels SynthBee à Fort Lauderdale, en Floride, et en tant que cofondateur du programme First Languages AI Reality (FLAIR) à l’Institut d’intelligence artificielle Mila-Québec à Montréal, au Canada, Running Wolf possède une compréhension approfondie de la technologie sous-jacente à l’IA et des avantages sociétaux qu’elle pourrait débloquer. Et en tant que fils de parents Lakota et Cheyenne, il sait aussi comment la technologie et les données ont été utilisées comme armes pour nuire aux communautés autochtones. Running Wolf aborde donc son travail – dans lequel il revitalise des langues en voie de disparition à l’aide d’outils d’IA et de réalité virtuelle – avec patience, empathie et une bonne dose de scepticisme.

« Le travail de Michael est si sophistiqué et complexe parce qu’il fait le lien entre le sacré et la science », explique Estakio Beltran, conseiller en partenariat de l’organisation à but non lucratif Native Americans in Philanthropy à Washington DC, qui collabore avec Running Wolf et est d’origine toltèque-mexicaine et tlatoani. « Nous avons la chance de l’avoir à la tête des efforts de réappropriation des langues autochtones, car ses principales pensées sont de protéger et d’honorer la souveraineté autochtone. »

Comment les chercheurs peuvent travailler équitablement avec les connaissances autochtones et locales

Running Wolf a grandi juste à l’extérieur de la réserve indienne Northern Cheyenne, dans le sud-est du Montana, dans une ville isolée appelée Birney (population en 2020 : 97). Le village manquait souvent d’eau courante et d’électricité, mais c’était néanmoins un endroit réconfortant où il était entouré de sa famille, littéralement – tout le monde dans la ville était un parent élargi par sa mère, et Running Wolf n’a pas rencontré d’étranger avant de partir pour l’université à l’âge de 18 ans. Il a passé son enfance à apprendre l’art traditionnel Cheyenne et Lakota et à entendre parler des langues autochtones autour de lui, une expérience qui est maintenant de plus en plus rare.

« Pendant des décennies, le gouvernement américain a supervisé des politiques d’assimilation forcée, et dans ce cadre, il était illégal de parler des langues traditionnelles ou de pratiquer ouvertement nos cultures », dit-il. « Ces politiques ont souvent été appliquées violemment, et nous avons donc perdu des générations de locuteurs courants, ce qui rend vraiment difficile le retour à partir de maintenant. »

Running Wolf était un bon élève dès son plus jeune âge, dit-il, et a rapidement développé un intérêt pour la technologie, stimulé par la carrière de sa mère en tant que lithographe laser concevant des micropuces pour la société informatique Hewlett-Packard dans le Colorado. Il a appris les bases de la programmation informatique à l’école primaire, notamment en apprenant à reprogrammer sa calculatrice graphique pour jouer à des jeux tels que Snake. Cependant, lorsqu’il s’est agi de choisir un cursus à l’Université d’État du Montana à Bozeman en 1999, Running Wolf dit qu’il a choisi le domaine alors naissant de l’informatique par instinct. « Personne dans ma famille, ni même mon conseiller d’orientation, ne savait vraiment ce que c’était. »

Même s’il s’est tourné vers le développement de logiciels, Running Wolf a conservé un intérêt pour l’histoire autochtone, notant que s’il n’était pas devenu un chercheur en IA, il serait probablement devenu un artiste ou un poète comme son père, qui détient un diplôme en beaux-arts. Lorsqu’il est retourné à Bozeman en 2007 après un séjour de trois ans dans l’industrie pour obtenir une maîtrise en informatique, l’avenir de Running Wolf a commencé à prendre forme.

De l’exploitation à l’autonomisation : comment les chercheurs peuvent protéger les droits des peuples autochtones à posséder et à contrôler leurs données

Pour sa thèse de maîtrise, Running Wolf s’est inspiré des travaux de chercheurs qui avaient utilisé des histoires orales pour retracer les origines de contes tels que Le Petit Chaperon rouge et pour identifier les objets éligibles au rapatriement en vertu de la loi sur la protection et le rapatriement des tombes amérindiennes. Il a passé l’été 2014 en Sibérie, en Russie, à recueillir des histoires auprès des peuples autochtones locaux et à utiliser un type d’IA appelé traitement du langage naturel pour rechercher des similitudes entre leurs cultures et celles plus proches de chez lui. « D’un point de vue écologique, la région est très similaire au biome de Yellowstone dans le Montana, et je me suis donc intéressé à la façon dont ces types de forces façonnent la langue et la culture », dit-il. « Il a cessé d’être de l’informatique pure et a introduit des aspects de l’anthropologie. »

À cette époque, Running Wolf a également rencontré sa femme Caroline, membre de la nation Apsáalooke qui parle 11 langues et qui obtenait alors sa maîtrise en études amérindiennes. Ensemble, ils se sont penchés sur la façon dont les outils informatiques et les mégadonnées pourraient être utilisés pour améliorer la compréhension des cultures autochtones et se réapproprier les langues perdues. Les Nations Unies estiment qu’environ la moitié des 6 700 langues du monde – dont la majorité sont parlées par des peuples autochtones – sont en voie de disparaître d’ici 2100, mais Running Wolf affirme qu’il y a rarement des plans rigoureux en place pour les sauver.

« Nous étions tous les deux frustrés par le manque de progrès dans ce qui était fait à l’époque », dit Running Wolf. Il ajoute que Caroline s’est depuis jointe à lui pour cofonder une entreprise de technologie autochtone à but non lucratif appelée Buffalo Tongue et pour gérer des projets en cours axés sur les applications de l’IA et des technologies immersives pour se réapproprier les langues et les cultures autochtones. « Ce qui a commencé par ces conversations nocturnes a finalement donné le coup d’envoi de ce tout nouveau chapitre de l’utilisation de la technologie pour la réappropriation de la langue, et nous nous sommes simplement empêtrés dans cet espace. »

Les défis de l’IA

Les langues autochtones diffèrent de celles qui ont des racines latines d’une manière qui rend difficile leur réconciliation avec les cadres d’apprentissage automatique existants, explique Running Wolf. De nombreuses langues occidentales suivent une structure de phrase sujet-verbe-objet, par exemple, tandis que les langues autochtones ont tendance à être basées sur des verbes et polysynthétiques, ce qui signifie qu’un seul mot peut inclure plusieurs éléments qui, en anglais, seraient écrits comme des phrases entières. « Oiseau », par exemple, pourrait se traduire par quelque chose comme « l’animal ailé et volant qui croasse ».

Étant donné que les modèles d’IA générative prédisent le mot suivant d’une phrase sur la base des mots précédents, ces différences signifient que les algorithmes font souvent un mauvais travail de reconnaissance et de traduction des langues autochtones. Cependant, les modèles fonctionnent mieux lorsqu’ils incluent des langues autochtones, explique M. Running Wolf, car l’entraînement sur une plus grande diversité de données rend les algorithmes sous-jacents plus adaptatifs et plus flexibles, tout comme les personnes qui connaissent deux langues ont généralement plus de facilité à en apprendre une troisième. « Mais cela crée un risque pour les communautés lorsque nos données linguistiques sont soudainement précieuses », ajoute-t-il.

A member of Te Hiku Media working at laptops with members of the Māori community — Les membres du personnel de la société néo-zélandaise Te Hiku Media ont sollicité l’avis des communautés locales pour co-créer un système de reconnaissance vocale automatique pour la langue maorie te reo.Crédit : Te Hiku Media

Déjà, des entreprises telles qu’OpenAI, Amazon et Google se sont précipitées pour avoir accès aux données autochtones sur la langue et plus encore. Les entreprises utilisent ces informations pour développer des services et des produits qui sont ensuite proposés aux utilisateurs, souvent à un coût. La méfiance de longue date à l’égard de la façon dont leurs informations sont susceptibles d’être utilisées à mauvais escient a amené certaines communautés autochtones à renoncer à se tourner vers les technologies basées sur l’IA, une position que Running Wolf respecte.

« Malheureusement, une grande partie de ce type de recherche se fait sans consentement, et cela a déconcerté les gens qui essayaient même de s’engager », dit-il. « Il y a beaucoup de risques avec l’IA, et je pense donc que c’est une réponse très saine. »

Créer des outils pour le bien de la société

Running Wolf s’efforce de surmonter ces hésitations en créant des ressources par et pour les communautés autochtones qui les aident à s’informer sur leurs cultures et la technologie et, en retour, à leur donner plus de contrôle sur la façon dont leurs données sont utilisées.

Ses premiers efforts ont commencé par des groupes de réseau d’employés, dont un pour les chercheurs autochtones d’Amazon lorsque Running Wolf travaillait sur l’assistant alimenté par l’IA de l’entreprise, Alexa. Plus tard, Caroline et lui ont participé au lancement de deux initiatives plus vastes, Indigenous in AI et IndigiGenius. Ceux-ci s’associent à des groupes de pairs tels que la société de conseil en technologie de l’information Natives in Tech à Oklahoma City, en Oklahoma, le groupe de travail sur le protocole autochtone et l’intelligence artificielle et le projet de recherche Abundant Intelligences pour façonner l’avenir des efforts d’IA dirigés par les Autochtones. En 2019, les Running Wolfs ont participé à deux ateliers aux côtés de dizaines d’autres chercheurs pour produire un article décrivant la meilleure façon de concevoir et de créer des outils d’IA de manière éthique (J. E. Lewis et al. Protocole autochtone et intelligence artificielle ; CIFAR, 2020).

Source : Nature