Notasbit

Las mejores noticias de tecnología en un sólo lugar

Publicado por: Microsiervos

Publicado en: 26/12/2016 12:30

Escrito por: [email protected] (Wicho)

El misterio de la ley de Zipf y el lenguaje

Me ha encantado este vídeo de Vsauce en el que he redescubierto la ley de Zipf, que ya habíamos mencionado brevemente en esta casa hace algún tiempo pero de la que no me acordaba, y que recibe su nombre del lingüista y filólogo estadounidense George Kingsley Zipf, aunque la regularidad que describe parece haber sido vista antes por el esteganógrafo Jean-Baptiste Estoup y por el físico Felix Auerbach.

La ley de Zipf dice que la inmensa mayoría de las veces en un texto o conversación cualquiera la segunda palabra más usada de un idioma aparecerá la mitad de veces que la palabra más usada, la tercera palabra más usada un tercio de veces que la más usada, la cuarta palabra más usada un cuarto de veces que la más usada, y así sucesivamente.

En español, por ejemplo, las diez palabras más frecuentes según la RAE son de, la, que, el, en, y, a, los, se, del. Esto quiere decir que la palabra «la» aparece la mitad de veces que la palabra «de», que la palabra «que» aparece un tercio de veces que «de», «e» un cuarto de veces, etc, al menos en textos normales.

Nube de palabras correspondiente a esta anotación – Generada con NubeDePalabras.es

La ley de Zipf es una ley de potencias, lo que quiere decir que da igual el tamaño del texto que estemos estudiando y que esta proporción en la frecuencia de aparición de las palabras siempre se cumple. Así que da igual que hablemos …

Top noticias del 26 de Diciembre de 2016