Há mais de 7000 línguas (faladas e sinalizadas) no mundo, mas poucas delas podem ser experienciadas online de forma plena. Isso faz com que a internet de hoje não esteja nem perto de ser tão multilíngue e multimodal como nós somos enquanto pessoas. Um idioma é muito mais do que um meio para nos comunicarmos: é a forma como expressamos o que pensamos, cremos e sabemos. Ser multilíngue é honrar e afirmar toda a riqueza e as texturas de nossos múltiplos eus e nossos diferentes mundos. Mas como se sentiria, soaria, e seria uma internet verdadeiramente multilíngue e multimodal?
Visite o Relatório SOBRE o Estado dos Idiomas da Internet →
O primeiro Relatório sobre o Estado dos Idiomas da Internet, realizado em co-autoria pela Whose Knowledge?, o Oxford Internet Institute, e The Centre for Internet and Society, nasceu dessa pergunta. O projeto se estrutura em torno de três eixos: mapear o estado atual das línguas na internet; identificar os desafios e oportunidades para fazer com que a web seja mais multilíngue; e promover uma agenda de ação. Esta iniciativa foi elaborada ao longo de mais de dois anos, e a maior parte do trabalho de análise, entrevistas, e escrita aconteceu durante a pandemia de COVID-19. Foi necessário um grande esforço coletivo para dar vida a este relatório, com cerca de cem pessoas — desde autores até tradutores e revisores.
Este relatório digital, criado de forma comunitária, reúne contribuições em 13 idiomas, que representam 22 comunidades linguísticas em 12 países de todos os continentes povoados do mundo. A seção Números analisa problemas críticos relativos a idiomas em 39 plataformas digitais, apps e dispositivos que usamos amplamente em nossa vida cotidiana, incluindo insights detalhados sobre plataformas como Wikipédia e Google Maps. O relatório ancora essa análise de dados em Histórias que nos oferecem uma colagem de como diferentes pessoas e comunidades de todo o mundo experienciam a internet em seus próprios idiomas.
Nossos resultados mostram que a web não está sequer perto de ser tão multilíngue como imaginamos ou como necessitamos que seja. Aproximadamente 500 de mais de 7000 línguas faladas e sinalizadas estão representadas online seja em forma de conhecimento ou informação. Enquanto isso, 75% de quem acessa a internet o faz em apenas dez idiomas. Tais línguas, como o inglês, o mandarim, o espanhol, e o francês, geralmente têm uma história colonial europeia ou são regionalmente dominantes. As estruturas atuais e históricas de poder e privilégio são intrínsecas à forma como os idiomas estão (ou não) acessíveis na internet.
Lançamento e celebração multilíngues
Nós lançamos o Relatório sobre o Estado dos Idiomas da Internet no dia 23 de fevereiro de 2022, alinhades às celebrações da Década Internacional das Línguas Indígenas da UNESCO (2022-2032) e ao Dia Internacional da Língua Materna.
Depois de mais de dois anos de trabalho neste relatório, sabíamos que o lançamento deveria honrar os processos e princípios centrados nas comunidades e no multilinguismo. Começamos a conversa expondo de forma aberta três princípios fundamentais: amor, respeito, e solidariedade. Este conjunto de princípios orientadores nos permitiu estar mais conscientes de nossas posicionalidades e privilégios, e ser nossos múltiplos eus de forma plena durante a discussão.
Nos desafiamos a colocar em prática nossos princípios multilíngues, mesmo que isso significasse colocar à prova qualquer software de videoconferência. Queríamos que as pessoas participantes, que em sua maioria não falavam inglês como primeira língua, falassem em seus idiomas de escolha sempre que possível, para que pudessem estar à vontade em ser elas mesmas e compartilhar suas histórias e análises. Abraçar esses múltiplos idiomas permite que a riqueza e a profundidade de nossas experiências sejam compartilhadas de maneira mais completa e significativa.
Com isso em mente, nossas moderadoras — as co-diretoras Adele Godoy Vrana e Anasuya Sengupta, e nossa co-coordenadora de comunicação Claudia Pozo — falaram em português, inglês e espanhol. Enquanto isso, painelistas se expressaram em inglês, espanhol e bengali, e oferecemos tradução simultânea em cinco idiomas: inglês, espanhol, português, árabe, e bengali. Mais de 70 parceires, amigues, e aliades se juntaram à chamada, e o evento também foi transmitido ao vivo pelo YouTube.
Contando as histórias
Iniciamos o evento com um painel dedicado às Histórias que compõem o relatório, moderado por Claudia Pozo. As pessoas convidadas ao painel — Ana Alonso (México), Paska Darmawan (Indonésia), Claudia Soria (Itália) e Ishan Chakraborty (Índia) —, realizaram suas intervenções em espanhol, inglês e bengali respectivamente. Explicaram os obstáculos que enfrentam ao usar a internet e compartilharam seus sonhos para uma internet mais multilíngue. Suas contribuições destacaram a necessidade de uma rede multilíngue e multimodal, e sua importância para comunidades marginalizadas de todo o mundo. Com base em sua experiência como falante de zapoteco, Ana destacou a falta de espaço na internet para idiomas que não têm um sistema de escrita padronizado — o que compromete os esforços por acesso, documentação e preservação.
Painelistas questionaram quais eram os tipos de conteúdo disponível em diferentes idiomas e o que isso significa na experiência vivida das comunidades marginalizadas. Como uma pessoa queer com deficiência visual, Ishan abordou as intersecções dessas marginalidades no conteúdo online, como também o fez em suas contribuições ao relatório, disponíveis em inglês e bengali. “É meu dever criar conhecimento em meu próprio idioma”, disse.
Paska, da Indonésia, compartilhou sua experiência ao buscar conteúdo LGBTQIA+ em indonésio. Ao longo da vida, testemunhou como muitos textos e páginas apresentavam pontos de vista preconceituosos, enviesados e danosos sobre pessoas LGBTQIA+. Paska teve de recorrer ao inglês para obter respostas com um conteúdo que reconhecesse sua identidade. “Para aquelas pessoas que não podem falar inglês, nem sequer consigo imaginar o quão devastador deve ser tentar encontrar respostas para suas perguntas – que afirme suas identidades – e não poder fazê-lo”.
Outras histórias do nosso relatório incluem os desafios enfrentados por pessoas falantes de línguas minoritárias em relação às tecnologias de linguagem, assim como elementos políticos, sociais e culturais que trazem desafios para falantes de chindali no norte do Malawi. Das ferramentas de busca às redes sociais, essas contribuições mostram como, nas palavras da pesquisadora Claudia Soria, “a tecnologia nunca é neutra: é desenvolvida por seres humanos e, portanto, reflete sua mentalidade e cultura”.
Alguns artigos dão uma ideia dos esforços feitos para recuperar e manter vivas as línguas indígenas ao redor do mundo. Projetos como Indigemoji são construídos sobre um esforço multigeracional para criar emojis que representem o idioma indígena arrernte; enquanto isso, outros ensaios documentam a utilização de redes sociais pelos povos indígenas, como Twitter e suas hashtags, para sobrevivência e aprendizado dos idiomas.
De olho nos números
Os números e padrões analisados no relatório mostram a forma como as desigualdades impregnam até mesmo as plataformas digitais mais populares. Em um painel moderado por Anasuya Sengupta, autores e colaboradores — Martin Dittus (Alemanha/Reino Unido); Puthiya Purayil Sneha (Índia); Mandana Seyfeddinipur (Irã/Alemanha); Hillary Juma (Quênia/Reino Unido) – exploraram as tendências e reflexões obtidas por meio das estatísticas coletadas.
Martin Dittus apresentou as tendências identificadas a partir de uma pesquisa em 11 sites, 12 aplicativos Android e 16 iOS. Ele demonstrou como o suporte a idiomas da interface dessas plataformas e apps está limitado a determinadas línguas: algumas europeias, com histórico colonial (como inglês, espanhol e português) e certos idiomas dominantes regionalmente (como o árabe e o mandarim). Algumas plataformas conseguem fazê-lo melhor do que outras, como Wikipédia, Google Search e Facebook, que suportam mais de 100 idiomas cada uma. Enquanto isso, mais de 90% das pessoas usuárias da internet na África precisam falar um segundo idioma para navegar em diferentes plataformas. Como sublinhou Martin, o que destaca dos dados é a necessidade de “redefinir fundamentalmente nossas expectativas”. Segundo ele, “a questão não é ‘como suportar uma ou duas línguas.’ A questão é ‘como suportamos 7000 idiomas e fazemos com que falantes desses 7000 idiomas tenham o suporte necessário em sua experiência online”.
Esses números ganham vida graças à pesquisa de plataformas e aos casos analisados com mais detalhes, ambos disponíveis no relatório. Os pesquisadores Martin Dittus e Mark Graham exploram a geografia linguística de duas plataformas amplamente utilizadas: Wikipédia y Google Maps. Depois de explorar as desigualdades entre 300 idiomas na Wikipédia, constataram que as edições da enciclopédia variam muito em escala, tanto no número de artigos como no tamanho das comunidades de editores. Em média, apenas uma fração do conteúdo disponível em inglês está presente nas edições de outros idiomas da Wikipédia. Entretanto, essas discrepâncias não podem ser atribuídas apenas à quantidade de falantes de cada idioma. Alguns dos idiomas usados por centenas de milhões de pessoas, como o mandarim, o hindi, o árabe padrão, o bengali e o indonésio, têm edições muito menos completas na Wikipédia. Essa desigualdade também se reflete na cobertura geográfica da Wikipédia: muitos dos conteúdos sobre lugares do mundo estão escritas em inglês, enquanto que a cobertura geográfica em outros idiomas é muito mais limitada.
Encontramos padrões similares no Google Maps nas 10 línguas mais faladas do mundo, incluindo a cobertura de conteúdo local em Kolkata, Dar es Salaam e Nairóbi. Em geral, o conteúdo em inglês segue sendo priorizado no Google Maps, enquanto a cobertura em outras línguas majoritárias está muito limitada a regiões geográficas específicas, como o bengali e o hindi, com mapas que se limitam em grande medida ao Sul da Ásia. A pesquisa também indica que, quando os resultados de uma busca não estão disponíveis em um idioma específico, o Google preenche essas brechas com conteúdo em língua estrangeira — que, geralmente, está disponível em inglês.
Por sua vez, as línguas minoritárias não costumam estar representadas no Google Maps e contam com muito menos suporte em comparação às línguas majoritárias. Ao analisar a cobertura de zulu e xhosa na África do Sul, e de guarani no Paraguai, Martin e Mark descobriram que esses idiomas praticamente não estão representados no Google Maps, apesar de terem milhões de falantes. Essa distribuição desigual na cobertura dos idiomas reflete, por um lado, as geografias linguísticas existentes e o tamanho da população e, por outro, revelam as propriedades linguísticas e circunstâncias sociais desses idiomas.
Tanto as Histórias quanto os Números nos permitem ver problemas em comum, que não são meramente linguísticos, mas sim políticos. “Este relatório aborda a escassez de dados sobre as línguas e faz com que as coisas fiquem visíveis na escala necessária para que a ação política aconteça. Mostra que a web e [suas] ferramentas são dominadas pelos detentores de sempre do poder”, disse Mandana.
Imaginando juntes
As pessoas que participaram do evento encerraram a conversa com uma reflexão, moderada por Adele Godoy Vrana, sobre o que gostariam de ver em uma internet verdadeiramente multilíngue. As intervenções incluíram ensejos de multilinguismo e multimodalidade online, assim como a priorização das necessidades das comunidades de línguas minoritárias. Quando questionados sobre quais emoções sentiam ao fim da sessão, participantes recorreram ao chat e abriram os microfones para se expressar em diferentes idiomas: gratidão, inspiração, esperança, alegria.
Gratidão
Nossas comunidades, incluindo financiadores, são parte fundamental deste trabalho. Não só compartilharam conosco seus conhecimentos, experiências e imaginações, mas também contribuíram substancialmente para a pesquisa, criação, e revisçao do conteúdo deste relatório em 13 idiomas. Queremos expressar nosso profundo agradecimento a todes por sua confiança. Para ter uma ideia mais ampla das pessoas incríveis que se somaram a este processo, visite a nossa seção de agradecimentos e a página sobre nossa equipe no site do relatório.
Novidades em breve!
Este relatório é um trabalho em constante progresso, e uma iniciativa de pesquisa em curso — ou seja, o lançamento foi apenas o primeiro passo. O site do Relatório sobre o Estado dos Idiomas da Internet (atualmente disponível em inglês, indonésio, bengali, português, suaíli, espanhol, zapoteco, francês e árabe, e em breve em mandarim taiwanês e língua de sinais internacional), será atualizado constantemente e estamos abertas e agradecidas a tradutores que queiram traduzi-lo a outros idiomas e parceires que estejam dispostos a se unir e nos apoiar.
Vamos manter essa conversa em nossos diferentes canais com as hashtags #InternetsLanguages, #IdiomasdaInternet e #LenguasenInternet em nossas redes sociais (Twitter, Instagram e Facebook). Leia mais sobre como colaborar conosco, os slides do lançamento, e veja abaixo as gravações em diferentes idiomas… e não se esqueça de compartilhar o relatório amplamente!