Quase todas as línguas seguem a lei matemática de Zipf. Ninguém sabe porquê

1

American Heritage Schools

Na grande maioria das línguas, a palavra mais comum é usada cerca de duas vezes mais do que a segunda palavra mais comum, três vezes mais do que a terceira, e por aí fora. O estranho fenómeno continua sem explicação.

Apesar da crença da humanidade na imprevisibilidade do livre arbítrio, a linguística desafia esta noção comum com um fenómeno estatístico peculiar conhecido como lei de Zipf.

Este princípio sugere que a frequência das palavras na maior parte das línguas segue um padrão previsível, e o mistério da razão pela qual se mantém continua a confundir linguistas e cientistas.

Observada pela primeira vez pelo linguista George Kingsley Zipf há mais de 80 anos, a lei postula que a palavra mais comum numa língua é usada aproximadamente duas vezes mais do que a segunda palavra mais comum, três vezes mais do que a terceira, e assim por diante.

Isto cria uma distribuição de lei de potência da frequência de palavras, expressa matematicamente como f(r)∝r-α, em que f é a frequência da palavra, r a sua classificação e α o expoente, explica o IFLScience.

Esta não é uma anomalia, já que a lei de Zipf aplica-se à maioria das línguas humanas. Surpreendentemente, até se estende a escritas não decifradas como o Manuscrito Voynich. Grandes textos, como A Origem das Espécies, de Charles Darwin, ou Hamlet, de Shakespeare, também apresentam este padrão, reforçando a sua ubiquidade.

As razões por detrás deste fenómeno continuam a ser especulativas. Uma teoria do próprio Zipf atribui-o à eficiência cognitiva: os oradores minimizam o esforço usando frequentemente palavras comuns, enquanto os ouvintes confiam em palavras menos comuns para maior clareza.

Outra hipótese sugere um “efeito bola de neve”, em que as palavras mais usadas ganham popularidade ao longo do tempo devido à sua adoção generalizada.

A consistência da lei é tão intrigante quanto fascinante. O padrão não parece fazer referência ao significado ou função de uma palavra, deixando as suas origens no domínio da especulação.

Para quem está interessado pode testar o princípio analisando a frequência das palavras num texto longo. Os resultados podem desafiar a noção de livre-arbítrio, uma vez que até a escrita pessoal está em conformidade com esta impressionante previsibilidade.

Será esta a prova final de que vivemos mesmo numa simulação?

Adriana Peixoto, ZAP //

Siga o ZAP no Whatsapp

1 Comment

  1. E pode apenas ser a formulação de uma aproximação de como o pensamento humano se organiza para formar e usar palavras.

    Editar – 

Deixe o seu comentário

Your email address will not be published.