Você está aqui: Página Inicial / NOTÍCIAS / Ampliando a comunicação em língua indígena com tecnologias digitais

Ampliando a comunicação em língua indígena com tecnologias digitais

por Mauro Bellesa - publicado 07/08/2025 11:30 - última modificação 07/08/2025 15:25

Durante seu período como professor visitante do IEA (maio/2023-maio/2025, o cientista da computação Claudio Pinhanez deu prosseguimento a seus projetos sobre o uso de tecnologias digitais e inteligência artifical na vitalização de línguas indígenas.

Sala digital em comunidade baré em Tabocal dos Pereira, AM
O cientista da computação Claudio Pinhanez fala com jovens de comunidade baré em Tabocal dos Pereira, AM

Grande parte das comunidades indígenas brasileiras já possui conexão em alta velocidade com a internet. No entanto, muitas delas ainda não podem obter informações ou se comunicar fazendo uso de sua própria língua pela ausência de ferramentas digitais, como tradutores, conversores de fala em texto, aplicativos diversos e até mesmo configurações de teclado adequadas, que incorporem diacríticos e caracteres especiais. Essa lacuna começou a ser preenchida nos últimos anos graças à atuação de pesquisadores brasileiros de várias universidades (inclusive do exterior) e de profissionais de organizações e empresas.

Mas há uma precondição para que tecnologias digitais, inclusive inteligência artificial, sejam aplicadas a uma língua indígena: a comunidade de seus falantes precisa ver importância nisso e concordar com a realização do trabalho. Essa obrigatoriedade é enfatizada pelo cientista da computação Claudio Pinhanez, professor visitante do IEA de maio/2023 a maio/2025 e vice-diretor do Centro de Inteligência Artificial (C4AI, na sigla em inglês), parceria entre USP, IBM e Fapesp.

Seminários

Uma de suas atividades no IEA foi a organização do ciclo de seminários “Tecnologias Digitais e Línguas Indígenas”, de setembro a dezembro de 2024. A série de encontros procurou fazer um primeiro apanhado de pessoas que têm feito progressos na área. Além disso, os vídeos dos seminários serão uma referência para pesquisadores de computação que queiram ter uma ideia do que já está sendo feito em línguas indígenas, diz Pinhanez. “Os interessados vão encontrar lá informações sobre as possibilidades de uso de tecnologias digitais na vitalização das línguas, aspectos técnicos de linguística computacional e estruturação de dados, desenvolvimento de aplicativos de ensino e até sobre a configuração de teclados específicos, pois é preciso tudo seja visível na tela, senão os recursos criados não vão chegar ao usuário”, afirma.

Vídeos dos seminários
do ciclo "Tecnologias Digitais
e Línguas Indígenas"

Além de Pinhanez, que atua também com pesquisador principal do grupo Conversational Intelligence da IBM Research Brasil, foram expositores no ciclo: Paulo Cavalin (IBM Research Brasil), e Marcelo Finger (Instituto de Matemática e Estatística da USP), Aline Villavicencio (Universidade de Exeter, Reino Unido), Natália Falcão (Motorola), Leonel Figueiredo de Alencar (Universidade Federal do Ceará) e Suellen Tobler (desenvolvedora do Nheengatu App).

Novo projeto

Na época do ciclo, o grupo de Pinhanez no C4AI dava continuidade a projetos ligados a comunidades guarani mbya no estado de São Paulo e começava a delinear o projeto atual, voltado à produção de ferramentas digitais para duas comunidades do povo baré situadas na região do Alto Rio Negro, no estado do Amazonas.

Os barés são falantes da variante amazônica do nheengatu, língua franca derivada da língua geral (séculos 16 a 18), por sua vez, uma forma simplificada e adaptada do tupi antigo. Assim como outros povos, os barés adotaram o nheengatu em substituição à sua língua original por causa do contato com missionários e da colonização. A língua baré – da família linguística aruaque – está quase extinta.

“No ano passado, já havíamos iniciado pesquisas com o processamento do nheengatu e mantínhamos conversas com um grupo de professores que trabalha com a língua. Em setembro de 2024, a convite de duas comunidades, fizemos uma visita de 3 dias. Vimos a oportunidade de uma boa parceria e assinamos acordos com as entidades dos indígenas. Na segunda semana de julho fomos lá instalar os equipamentos de uma sala de aula digital”, relata Pinhanez.

Organização

Ele considera que as comunidades de linguistas e de antropólogos dedicadas aos indígenas são bem-organizadas, mas a de computação em geral e de inteligência artificial está começando a surgir. “Ainda não há uma proposta de constituição de uma rede, mas é uma coisa que em algum momento precisará ser feita”, afirma.

A pesquisa na área está precisando de coordenação, algo como um projeto no CNPq com a liderança de pelo menos dois acadêmicos de universidades diferentes, para aglutinar as várias iniciativas espalhadas pelo país e possibilitar a colaboração entre os pesquisadores e a centralização das informações, defende Pinhanez. “É fundamental que algo assim esteja sediado numa universidade, que possui um prazo de desenvolvimento de pesquisa mais longo do que o das empresas.”

Sala digital em comunidade baré em Juruti, AM
Sala de aula digital na comunidade baré de Juruti, AM
A criação de um programa governamental de financiamento de projetos tecnológicos com comunidades indígenas também é algo importante, segundo ele, mas considera que isso deveria estar sob o guarda-chuva do Ministério da Ciência, Tecnologia e Inovação (MCTI). “Não é o caso de o Ministério dos Povos Indígenas cuidar disso, pois tem poucos recursos, que devem ser destinados a questões prioritárias para as comunidades.”

Ele chegou a conversar sobre o assunto com representantes do MCTI durante um encontro da Comissão Econômica para a América Latina e o Caribe (Cepal), no Chile, e verificou que as línguas indígenas “não eram uma prioridade do ministério". Soube também que há um grande projeto sobre línguas envolvendo Europa, América Latina e Caribe. "Esse projeto poderia contribuir, mas é voltado sobretudo para as línguas majoritárias da região."

Novos desafios

Pinhanez reconhece a importância do trabalho que vem sendo feito há um bom tempo na formação de professores indígenas. Aponta que é algo difícil, pois exige oferecer cursos de licenciatura aos candidatos. “A atividade dos professores é ensinar crianças falantes a ler e escrever, além de dar aulas de outras disciplinas. É uma filosofia bilingue, empreendida com grande dificuldade. Funciona; melhor em alguns lugares, pior em outros.” No entanto, é uma visão de preservação da língua do século 20, de acordo com ele. “O século 21 apresenta novos desafios e um deles é a chegada da internet. A língua tem de estar viva na internet, porque os jovens querem viver nela.”

Ele explica que um projeto com língua indígena não traz contribuições que possam ser aplicadas em outras áreas, já que a quantidade de dados utilizada é pequena, diretamente relacionada com a quantidade de falantes. Mas é isso justamente que torna a atividade estimulante para um doutorando, o desafio de trabalhar com poucos dados, os quais não existem nos modelos feitos até hoje, afirma. Num trabalho de conclusão de curso de graduação, o principal desafio é cruzar uma fronteira cultural, o que se torna também o principal benefício, pois se ele conseguir trabalhar bem com uma cultura totalmente diferente, vai conseguir trabalhar bem dentro de uma empresa, com outras empresas, com o governo."

Aspectos éticos

Como tudo que envolve a coleta de dados individuais ou coletivos, o uso da computação em línguas indígenas também envolve questões éticas. “A primeira coisa a ser considerada é a relação que os indígenas têm com a língua, que é diferente da relação de não indígenas com sua própria língua. A língua indígena é muito identitária. Muitas vezes o uso da língua os define como indígenas. Há diversos outros aspectos. Não é incomum, por exemplo, que certas coisas só sejam faladas pelos homens. E há falas que só podem ser usadas em cerimônias", diz.

Pinhanez comenta que é frequente surgirem alegações de apropriação cultural: “As situações são variadas. O caso do nheengatu é diferente, pois é uma língua derivada da língua geral, não está associada a nenhuma etnia. Além disso, deve-se considerar que há diferentes níveis de interação entre comunidades indígenas com não-indígenas. Nossa política é primeiro conversar com as organizações políticas e sociais da comunidade. Existir essa estrutura representativa é precondição. Se for um grupo pouco estruturado política e socialmente, a conversa fica muito difícil.”

Atuação indígena

Mas e quanto à participação dos próprios indígenas no trabalho computacional? Ele diz que isso é algo que deve ser desenvolvido e estimulado, mas as comunidades têm de achar esse envolvimento relevante. Lembra que há indígenas atuando ou estudando em várias áreas, como linguística, antropologia, direito, saúde e engenharia. "Geralmente, se dedicam a áreas importantes para suas comunidades. Ao enviar um jovem para uma universidade, a comunidade faz um investimento importante, por isso a escolha tem de ser criteriosa”, afirma.

Ao iniciar um projeto, o grupo de Pinhanez parte do desenvolvimento de um aplicativo, para despertar o interesse dos jovens em entender o processo. Em seguida, eles são informados sobre os cursos de computação. Com isso, é natural que parte deles se interesse e explique à comunidade por que seria importante que fossem enviados para um curso. “Falando com os jovens, percebemos que há muito interesse. No caso dos barés, contratamos duas delas indicadas pela comunidade. Uma fez curso de tecnologia da informação em São Gabriel da Cachoeira e a outra é autodidata. Elas darão suporte técnico na sala de aula digital”, diz.

As comunidades precisam ter alguém habilitado em tecnologia da informação para gerenciar a infraestrutura de comunicação, resolver os problemas de segurança e ensinar as pessoas a usarem os recursos disponíveis. Essa necessidade já está razoavelmente resolvida em boa parte das comunidades do país, segundo Pinhanez. O objetivo de seu grupo e de outros pesquisadores é criar condições para uma verdadeira inclusão digital dos indígenas, possibilitando àqueles que assim o desejarem utilizar sua própria língua em todos os recursos propiciados pela internet.

Fotos: Projeto Yẽgatu Digital/Divulgação