Лингвистический анализ: Читая «Лолиту» в Тегеране (Азар Нафиси)
Общая статистика
Длина текста | 828554 знаков |
Длина диалогов | 67442 знаков |
Слов в произведении (СВП) | 124620 слов |
Приблизительно страниц | 461 стр. |
Средняя длина слова | 5.39 знаков |
Предложений в произведении (ПВП) | 8196 предл. |
Средняя длина предложения (СДП) | 98.19 знаков |
Доля диалогов в тексте | 8.14 % |
Доля авторского текста | 91.86 % |
СДП диалогов | 99.81 знаков |
СДП авторского текста | 113.34 знаков |
|
Максимальный фрагмент авторского текста - 102387 знаков (в страницах - примерно 57, начинается где-то с 273 страницы) |
Активный словарный запас
Использовано уникальных слов | 25164 | |
Активный словарный запас (АСЗ) | 24604 | |
Активный не словарный запас (АНСЗ) | 560 | |
Удельный АСЗ на 3000 слов текста | 1556.45 | 123834 место в рейтинге УАСЗ-3000 |
Удельный АСЗ на 10000 слов текста | 4119.71 | 401723 место в рейтинге УАСЗ-10000 |
Удельный АСЗ на 100000 слов текста | 21856.63 | 79025 место в рейтинге УАСЗ-100000 |
|
Максимальный УАСЗ-3000 (1798) наблюдается примерно на 451 странице |
Минимальный УАСЗ-3000 (1283) наблюдается примерно на 395 странице |
|
Буквы и знаки препинания
Всего букв | 670528 букв |
Всего знаков препинания | 24030 знаков |
Знак | Кол-во (шт.) | Средн. кол-во на 1000 слов (шт.) |
, | 13181 | 105.77 |
. | 7421 | 59.55 |
- | 774 | 6.21 |
? | 718 | 5.76 |
! | 139 | 1.12 |
... | 0 | 0.00 |
!.. | 0 | 0.00 |
?.. | 1 | 0.01 |
!!! | 0 | 0.00 |
?! | 1 | 0.01 |
" | 0 | 0.00 |
() | 100 | 0.80 |
: | 641 | 5.14 |
; | 1054 | 8.46 |
Буква | Кол-во (шт.) | Частота использования (в %) |
А | 56808 | 8.47 |
Б | 10547 | 1.57 |
В | 29162 | 4.35 |
Г | 10952 | 1.63 |
Д | 19636 | 2.93 |
Е-Ё | 55744 | 8.31 |
Ж | 10952 | 1.63 |
З | 11651 | 1.74 |
И-Й | 60771 | 9.06 |
К | 20486 | 3.06 |
Л | 31186 | 4.65 |
М | 23814 | 3.55 |
Н | 45629 | 6.80 |
О | 69974 | 10.44 |
П | 17165 | 2.56 |
Р | 29820 | 4.45 |
С | 37079 | 5.53 |
Т | 41188 | 6.14 |
У | 17410 | 2.60 |
Ф | 1437 | 0.21 |
Х | 6457 | 0.96 |
Ц | 2832 | 0.42 |
Ч | 9791 | 1.46 |
Ш | 5179 | 0.77 |
Щ | 2230 | 0.33 |
Ь-Ъ | 12530 | 1.87 |
Ы | 12962 | 1.93 |
Э | 2320 | 0.35 |
Ю | 4484 | 0.67 |
Я | 14096 | 2.10 |
|
Части речи
Определенных частей речи (ОЧР) | 124492 слов |
Не определенных частей речи (НОЧР) | 128 слов |
Часть речи | Кол-во (шт.) | % в тексте (ОЧР - 100%) |
Сущ. | 33710 | 27.078 |
Глаг. | 13778 | 17.975 |
Мест.-сущ. | 13778 | 11.067 |
Предл. | 9452 | 10.940 |
Союз | 11293 | 9 |
Прилаг. | 9452 | 7.592 |
Нареч. | 5723 | 4.597 |
Местоим-прилаг. | 6928 | 5.565 |
Частица | 4752 | 3.817 |
Местоим. нареч. | 1820 | 1.462 |
Числит. | 730 | 0.586 |
Числит-прилаг. | 275 | 0.221 |
Междомет. | 21 | 0.017 |
Часть комп. сложн. слова | 13 | 0.010 |
Биграммы частей речи
В таблице показаны частоты словопар типа «сглагол+уществительное», «предлог+прилагательное» и т.д. Частота выражена в среднем количестве пары на 1000 слов текста. Вертикаль отражает часть речи первого слова биграммы, горизонталь — второго.
| Сущ. | Глаг. | Мест.-сущ. | Предл. | Союз | Прилаг. | Нареч. | Местоим-прилаг. | Частица | Местоим. нареч. | Числит. | Числит-прилаг. | Междомет. | Часть комп. сложн. слова |
Сущ. | 52.99 | 47.85 | 26.72 | 41.09 | 44.63 | 14.66 | 12.55 | 15.47 | 8.23 | 4.92 | 0.99 | 0.57 | 0.10 | 0.02 |
Глаг. | 36.42 | 19.47 | 24.67 | 37.32 | 19.75 | 12.92 | 8.93 | 9.90 | 6.51 | 2.37 | 1.33 | 0.13 | 0.01 | 0.01 |
Мест.-сущ. | 15.02 | 43.38 | 6.20 | 8.45 | 7.23 | 6.05 | 8.60 | 3.70 | 9.09 | 2.55 | 0.29 | 0.09 | 0.02 | 0.00 |
Предл. | 53.76 | 1.16 | 19.14 | 0.84 | 0.84 | 14.54 | 0.62 | 15.67 | 0.11 | 0.09 | 1.61 | 1.00 | 0.01 | 0.01 |
Союз | 19.15 | 19.89 | 15.64 | 7.33 | 3.14 | 6.74 | 6.19 | 4.92 | 5.24 | 2.04 | 0.33 | 0.10 | 0.02 | 0.01 |
Прилаг. | 51.78 | 3.86 | 2.35 | 2.79 | 5.98 | 6.27 | 0.82 | 0.80 | 0.74 | 0.33 | 0.17 | 0.03 | 0.00 | 0.01 |
Нареч. | 3.19 | 16.31 | 5.25 | 4.80 | 3.68 | 4.67 | 2.91 | 1.34 | 2.69 | 0.66 | 0.43 | 0.04 | 0.01 | 0.00 |
Местоим-прилаг. | 27.95 | 6.09 | 4.31 | 2.60 | 1.47 | 6.95 | 1.92 | 1.70 | 1.77 | 0.50 | 0.18 | 0.19 | 0.01 | 0.02 |
Частица | 3.83 | 17.86 | 3.62 | 3.07 | 1.38 | 1.93 | 1.98 | 1.60 | 1.84 | 0.86 | 0.19 | 0.01 | 0.00 | 0.00 |
Местоим. нареч. | 0.99 | 3.46 | 2.59 | 0.88 | 2.30 | 0.56 | 1.34 | 0.31 | 1.89 | 0.28 | 0.02 | 0.01 | 0.00 | 0.00 |
Числит. | 3.94 | 0.28 | 0.08 | 0.18 | 0.21 | 0.48 | 0.10 | 0.22 | 0.02 | 0.02 | 0.27 | 0.04 | 0.00 | 0.00 |
Числит-прилаг. | 1.66 | 0.11 | 0.08 | 0.06 | 0.06 | 0.13 | 0.01 | 0.02 | 0.02 | 0.00 | 0.05 | 0.00 | 0.00 | 0.00 |
Междомет. | 0.05 | 0.03 | 0.02 | 0.00 | 0.04 | 0.00 | 0.01 | 0.00 | 0.02 | 0.00 | 0.00 | 0.00 | 0.01 | 0.00 |
Часть комп. сложн. слова | 0.04 | 0.00 | 0.00 | 0.00 | 0.00 | 0.02 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 | 0.04 |
Части речи на позициях в предложении
Таблица показывает, с какой частотой употреблены автором различные части на позициях в предложении. Например, ячейка «глагол – 3» показывает с какой вероятностью третье слово в случайно взятом предложении произведения является глаголом. Вероятность выражена в процентах. В каждом столбце максимальное значение отмечено розовым цветом, что позволяет по первым трём-пяти столбцам примерно представить типичное для произведения начало предлоджения. Например, последовательность «местоимение-существительное, глагол, прилагательное, существительное» может быть чем-то вроде «Он срубил старое дерево...»
| Номер слова в предложении |
| 1 | 2 | 3 | 4 | 5 |
Сущ. | 15.92 | 20.55 | 24.32 | 24.81 | 26.23 |
Глаг. | 9.12 | 27.47 | 23.30 | 20.13 | 19.81 |
Мест.-сущ. | 25.69 | 13.43 | 11.45 | 12.68 | 10.51 |
Предл. | 13.80 | 7.26 | 10.77 | 11.88 | 10.52 |
Союз | 12.54 | 4.50 | 6.74 | 8.24 | 9.03 |
Прилаг. | 3.02 | 4.72 | 5.63 | 7.31 | 8.01 |
Нареч. | 6.79 | 6.09 | 5.37 | 4.21 | 4.46 |
Местоим-прилаг. | 5.45 | 6.06 | 5.18 | 4.84 | 5.24 |
Частица | 4.03 | 6.19 | 4.99 | 3.75 | 3.95 |
Местоим. нареч. | 2.66 | 2.08 | 1.30 | 1.38 | 1.32 |
Числит. | 0.60 | 0.96 | 0.69 | 0.52 | 0.63 |
Числит-прилаг. | 0.26 | 0.69 | 0.24 | 0.22 | 0.26 |
Междомет. | 0.15 | 0.00 | 0.00 | 0.03 | 0.00 |
Часть комп. сложн. слова | 0.00 | 0.00 | 0.01 | 0.00 | 0.01 |
| Номер слова в предложении |
| 6 | 7 | 8 | 9 | 10 |
Сущ. | 25.81 | 26.19 | 26.46 | 25.48 | 26.37 |
Глаг. | 19.99 | 17.75 | 17.53 | 17.48 | 16.68 |
Мест.-сущ. | 9.28 | 9.79 | 9.81 | 10.08 | 9.98 |
Предл. | 10.88 | 12.18 | 11.33 | 11.88 | 12.49 |
Союз | 9.49 | 10.30 | 9.69 | 9.77 | 10.24 |
Прилаг. | 8.40 | 8.01 | 8.50 | 8.66 | 8.61 |
Нареч. | 4.61 | 4.54 | 4.80 | 4.43 | 4.09 |
Местоим-прилаг. | 5.76 | 5.79 | 6.25 | 6.05 | 5.59 |
Частица | 3.80 | 3.43 | 3.68 | 3.94 | 3.86 |
Местоим. нареч. | 1.07 | 1.24 | 1.15 | 1.40 | 1.36 |
Числит. | 0.69 | 0.57 | 0.68 | 0.58 | 0.57 |
Числит-прилаг. | 0.17 | 0.20 | 0.11 | 0.25 | 0.18 |
Междомет. | 0.01 | 0.00 | 0.00 | 0.00 | 0.00 |
Часть комп. сложн. слова | 0.03 | 0.01 | 0.02 | 0.02 | 0.00 |
| Номер слова в предложении |
| 11 | 12 | 13 | 14 | 15 |
Сущ. | 25.43 | 26.21 | 25.22 | 26.71 | 26.09 |
Глаг. | 17.74 | 17.45 | 16.00 | 16.75 | 15.51 |
Мест.-сущ. | 9.90 | 9.98 | 9.33 | 9.84 | 10.31 |
Предл. | 11.90 | 11.82 | 12.44 | 10.69 | 12.18 |
Союз | 10.05 | 9.52 | 10.22 | 9.47 | 10.55 |
Прилаг. | 8.68 | 8.29 | 9.95 | 10.06 | 9.29 |
Нареч. | 4.04 | 4.00 | 4.58 | 4.25 | 3.95 |
Местоим-прилаг. | 6.26 | 6.32 | 5.65 | 6.05 | 5.90 |
Частица | 3.79 | 4.17 | 3.92 | 3.54 | 4.37 |
Местоим. нареч. | 1.43 | 1.40 | 1.85 | 1.51 | 1.23 |
Числит. | 0.61 | 0.64 | 0.65 | 0.93 | 0.40 |
Числит-прилаг. | 0.15 | 0.18 | 0.20 | 0.20 | 0.21 |
Междомет. | 0.02 | 0.02 | 0.00 | 0.00 | 0.00 |
Часть комп. сложн. слова | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 |
Последние комментарии
3 часов 13 минут назад
3 часов 26 минут назад
3 часов 59 минут назад
4 часов 32 минут назад
20 часов 1 минута назад
20 часов 11 минут назад