«Х» против «Л»
Тут в заметке про переставленные «АХ» и «АЛ» у одного из читателей возникла дельная идея — возможно перестановка этих букв отражает статистику. Не может ли быть «АХ» более частотной, чем «АЛ»?
Я взял базу татарстанского документооборота (всё-таки в Татарстане набор фамилий отличается от центральной России) и посмотрел сколько раз встречаются эти буквы на второй позиции. В базе полторы тысячи человек, довольно репрезентативная выборка.
«Л» оказалась частотней «Х», что совпадает с их позициями в частотном распределении по русскому языку и, как будто бы, отвергает читательскую теорию.
Но позже, когда пошёл на обед, я понял, что задачу решил неправильно. Зачем смотреть только на вторую букву? Вторая буква нам интересна только в контексте. В общем, пересчитал. Встречаемость «АЛ» в Татарстане — 11534, «АХ» — 14153, таким образом, версия имеет право на существование.
1.5М челоек в СЭДе? Это получается почти каждый второй житель? Или всё же это не по только Татарстану?
Там в базе не только пользователи, но и граждане.