O Laboratório de Ciências da Computação e Inteligência Artificial (CSAIL) do MIT está com um projeto que pode trazer de volta à vida línguas humanas que foram consideradas como mortas. Segundo os gestores do projeto, não será necessário um idioma contemporâneo equivalente.
Segundo especialistas linguísticos, as línguas perdidas são traduzidas por um método de comparação, relacionando assim um idioma antigo a alguma variação contemporânea utilizando algoritmos automatizados.
No Brasil, existem diversas línguas que são faladas de formas diferentes, como o portunhol, línguas indígenas e línguas imigrantes. Além disso, ainda existem línguas indígenas que foram perdidas ao passar dos anos no Brasil, e o intuito do grupo é ressuscitar essas línguas.
Projeto utilizará outro método de estudo para ressuscitar idiomas
A ideia do grupo de cientistas é atribuir a criação de idiomas atuais à linguagens antigas para a forma como falamos, semelhante a uma “engenharia reversa”. Porém, o problema é que estes idiomas são desconhecidos e não há nenhum registro de como funcionava a ordem da fala e significado.
No projeto que está sendo guiado pelo CSAIL segue outra vertente de estudos, utilizando bases linguísticas baseadas no conhecimento de progressão dos idiomas. Por exemplo, se uma língua adicionar ou apagar um fonema, ou som, provavelmente ocorrerão modificações na língua contemporânea.
Uma palavra que tinha uma fonética com o som de “P” na língua nativa, é provável que esse som tenha mudado para “B” no idioma descendente. Então seguindo essa lógica, é muito improvável que o mesmo som mude para um “K” já que a pronunciação é distinta.
Inteligência Artificial do MIT está sendo desenvolvido para estudar semântica de palavras
A Inteligência Artificial do MIT está apostando em um novo algoritmo que consegue analisar diversas possibilidades de transformação e inclusão de fonemas linguísticos. Em suma, o sistema consegue capturar padrões de mudanças na língua esquecida e os expressa como valores computacionais.
O resultado desse algoritmo é o mapeamento de eventuais contrapartes em idiomas atuais. Nos testes feitos pelos linguistas, o algorítimo foi inserido em línguas ibéricas, bascas, germânicas, românticas, urálicas e turcomanas. Foi descoberto que mesmo que os idiomas bascos fossem próximos, os mesmo ainda se divergem demais para serem relacionados.
Em futuro próximo, o MIT ainda pretende identificar o significado semântico de certas palavras em línguas já conhecidas, embora o sistema não esteja preparada para lê-las. Esse processo é mais conhecido como “Decifração baseada em cognatos”.