Menu

Validação Multilingual de métricas de complexidade das línguas humanas.

Integrantes: Gabriel Ferreira de Souza Araujo, Lucas Irineu Rebouças Guimarães
Orientador: Marcelo Finger.
Coorientador: Felipe Ribas Serras

Scroll

Introdução

Nas ciências das linguagens humanas, um dos grandes problemas em aberto é o de como definir a complexidade de uma língua, um texto, ou uma sentença de forma objetiva e computável. Resultados recentes sugerem algoritmos de medição de complexidade baseados em teoria da informação. Esses algoritmos degradam o texto de maneiras específicas e avaliam como a forma de degradá-lo influencia na sua compressibilidade. Essas métricas de complexidade se mostraram promissoras quando testadas em conjuntos de línguas indo-europeias, entretanto, para se ter uma medida de complexidade universal, é necessário testar seu comportamento contra um conjunto maior e mais diverso de linguagens. Nesse projeto, vamos contribuir para a validação dessas métricas em várias línguas humanas e realizarão testes sobre as métricas nesse conjunto de dados, para entender se as propriedades e realizar construções gráficas dos fenômenos ocorridos.

Objetivos

Validação de Métricas de Complexidade:

Validar métricas de complexidade baseadas em teoria da informação para avaliação objetiva e computável de línguas humanas.

Investigação da Universalidade das Métricas:

Investigar a universalidade das métricas de complexidade ao testá-las em um conjunto diverso de línguas humanas, visando compreender suas propriedades e aplicabilidade em diferentes contextos linguísticos.

Análise dos Resultados Obtidos:

Analisar os resultados dos testes das métricas de complexidade nos conjuntos de dados linguísticos coletados, identificando padrões e tendências que possam indicar sua eficácia e universalidade.

Contribuição para o Entendimento da Complexidade Linguística:

Contribuir para o entendimento da complexidade das línguas humanas ao discutir as conclusões alcançadas sobre a validade e a universalidade das métricas de complexidade testadas, além de sugerir possíveis direções para pesquisas futuras nesse campo.

Links