Рейтинг известных книг по количеству уникальных слов на 10.000 слов текста книги.
http://fantlab.ru/lprating/sz10/sz10/page1
Технология данных расчётов:
http://fantlab.ru/article374
В среднем 30 % слов в тексте более не повторяются в книге до её конца.
То есть, 7000 слов встречаются в рамках данной книги более одного раза, а 3000 слов - встречаются только один раз.
Возьмём для примера самое известное произведение мастера русского слова "
Человек-амфибия" ( Автор: Александр Беляев)
http://fantlab.ru/work3069/lp
Книга содержит согласно лингвистическому анализу произведения - 44630 слов.
Начинаем анализ:
85 процентов текста составляют 2000 самых часто употребляемых слов русской речи.
85% от 44630 слов = 37.936 слов отнимаем от 44.630 слов = остаётся 6.694 слова.
Отнимаем из 6.694 слов 5.953 слова, которые встречаются в книге "Человек-амфибия" не более 1 (одного) раза.
Остаётся = 740 слов.
По личному опыты склонен предположить, что данные слова повторяются в тексте в среднем не более одного раза(если округлить.)
Подсчитываем окончательную сумму слов, которые надо знать чтобы прочесть данную книгу без обращения к словарю:
2000 + 5953 + (740/2) = 2000 + 5953 + 370 =
8.323 слова!!!
Данные подсчёты можно распространить и на любой другой национальный язык вроде английского.
Но будут ли данные подсчёты отражать действительность для эсперанто?
Сложный вопрос в отсутствии исследований.
Могу только предположить, что более чем в национальном языке всё будет зависеть от стиля автора.
Эсперанто со своей системой суффиксов-приставок в отличие от национальных языков даёт очень много возможностей для резкого сокращения словарного запаса.
А вот будет ли эсперанто-писатель использовать возможности эсперанто на 100 процентов уже дело его мастерства и совести.
Уф...