Оригинал сообщенияКомментарии: 
Язык – очень интересный объект для наблюдений. Однако выводы и отчеты лингвистов и филологов зачастую не выходят за пределы их весьма узкого круга, как обычно, весьма далекого от народа. Популяризовать исследования, касающиеся языка не так-то просто. Но при желании, можно.Это доказывает проект
www.wordcount.org, который ведет подсчет частоты использования слов в английском языке. Делает он это с помощью
Британского Национального корпуса - огромного собрания текстов, отображающих язык во всем многообразии стилей, жанров, территориальных и социальных вариантов, и т.п. Программа анализирует этот массив, выбирает слова, которые встречаются в нем, по меньшей мере, дважды и расставляет их по порядку, в зависимости от того, насколько часто их употребляют. В результате образовалась «очередь» более чем из 86 000 слов.Чем популярнее слово, тем крупнее шрифт используется для его написания и эта визуализация очень наглядна. Однако, если забраться дальше первой двадцатки слов, все они будут одинаковыми по размеру. Вне конкуренции слово «the», да и вообще артикли, предлоги, частицы и союзы прочно обосновались в голове этого списка. Первое существительное, которое здесь встречается – это «time», на 66 месте. Таких открытий любопытный пользователь сделает много, тем более, что возможности для этого есть. Например, можно просто пролистывать весь список вперед по одному слову, и при необходимости возвращаться назад. А можно и посмотреть на какой позиции находится то или иное слово, или наоборот, посмотреть, что за слово стоит под каким-либо номером. Ну а последним в этой «очереди» находится слово «conquistador». Интересно также выявлять последовательности слов (например, одно за другим идут слова «Америка», «гарантировать», «нефть» и «возможность») или насколько близкие друг другу слова (по смыслу или привычные по словосочетаниям) отстоят друг от друга. В будущем авторы проекта планируют переориентировать его с Британского Национального корпуса на работу с любым текстом, сайтом и, в конечном счете, с интернетом в целом.
Раскрыть пост