Nas ciências das linguagens humanas, um dos grandes problemas em aberto é o de como definir a complexidade de uma língua, um texto, ou uma sentença de forma objetiva e computável. Resultados recentes sugerem algoritmos de medição de complexidade baseados em teoria da informação. Esses algoritmos degradam o texto de maneiras específicas e avaliam como a forma de degradá-lo influencia na sua compressibilidade. Essas métricas de complexidade se mostraram promissoras quando testadas em conjuntos de línguas indo-europeias, entretanto, para se ter uma medida de complexidade universal, é necessário testar seu comportamento contra um conjunto maior e mais diverso de linguagens. Nesse projeto, vamos contribuir para a validação dessas métricas em várias línguas humanas e realizarão testes sobre as métricas nesse conjunto de dados, para entender se as propriedades e realizar construções gráficas dos fenômenos ocorridos.