Como ya hemos visto varias veces en Algarabía, algunas letras se emplean más que otras y en cada idioma su frecuencia es distinta.
Con el fin de analizar lo que ocurre con el español hablado en México, se utilizó como base el corpus de casi dos millones de palabras, tomadas de textos de diversos orígenes y géneros, tanto hablados como escritos, formado por el Colegio de México para elaborar sus diccionarios.
Del corpus se tomaron las 848 palabras de más uso y se calculó qué tanto se emplea cada letra. Los resultados son los siguientes:
Las vocales representan casi la mitad —48.89%— del uso de las letras.
Las grafías k y w son tan ajenas a nuestro idioma que no aparecieron en ninguna de las palabras consideradas y, de hecho, se utilizan en menos de una palabra en cada dos mil. Si ordenamos las diez letras demás uso, de mayor a menor frecuencia, obtenemos: e, a, o, l, n, s, u, r, d e i.
Su distribución relativa es muy similar a lo que ocurre en el español de España.
La e es también la más empleada en algunos otros idiomas, como el inglés, el francés y el alemán.
Este tipo de análisis es útil para poder diseñar teclados de máquinas de escribir o de computadoras, en criptografía o para inventar juegos de mesa —como el Scrabble.
Como cosa curiosa, las letras que más se emplearon para escribir esta nota fueron: a, e, s, o y r.