Лингвистический анализ: Собор Парижской Богоматери / сборник (Виктор Гюго)
Общая статистика
Длина текста | 2219888 знаков |
Длина диалогов | 524751 знаков |
Слов в произведении (СВП) | 327314 слов |
Приблизительно страниц | 1234 стр. |
Средняя длина слова | 5.47 знаков |
Предложений в произведении (ПВП) | 26288 предл. |
Средняя длина предложения (СДП) | 81.61 знаков |
Доля диалогов в тексте | 23.64 % |
Доля авторского текста | 76.36 % |
СДП диалогов | 78.36 знаков |
СДП авторского текста | 102.39 знаков |
|
Максимальный фрагмент авторского текста - 152812 знаков (в страницах - примерно 85, начинается где-то с 553 страницы) |
Активный словарный запас
Использовано уникальных слов | 56725 | |
Активный словарный запас (АСЗ) | 52988 | |
Активный не словарный запас (АНСЗ) | 3737 | |
Удельный АСЗ на 3000 слов текста | 1616.29 | 306292 место в рейтинге УАСЗ-3000 |
Удельный АСЗ на 10000 слов текста | 4365.11 | 277902 место в рейтинге УАСЗ-10000 |
Удельный АСЗ на 100000 слов текста | 25640.47 | 55838 место в рейтинге УАСЗ-100000 |
|
Максимальный УАСЗ-3000 (1852) наблюдается примерно на 565 странице |
Минимальный УАСЗ-3000 (1291) наблюдается примерно на 1168 странице |
|
Буквы и знаки препинания
Всего букв | 1779500 букв |
Всего знаков препинания | 76247 знаков |
Знак | Кол-во (шт.) | Средн. кол-во на 1000 слов (шт.) |
, | 41023 | 125.33 |
. | 22898 | 69.96 |
- | 2769 | 8.46 |
? | 2075 | 6.34 |
! | 3195 | 9.76 |
... | 0 | 0.00 |
!.. | 98 | 0.30 |
?.. | 35 | 0.11 |
!!! | 0 | 0.00 |
?! | 18 | 0.05 |
" | 0 | 0.00 |
() | 377 | 1.15 |
: | 2062 | 6.30 |
; | 1697 | 5.18 |
Буква | Кол-во (шт.) | Частота использования (в %) |
А | 139482 | 7.84 |
Б | 32407 | 1.82 |
В | 81518 | 4.58 |
Г | 34773 | 1.95 |
Д | 56004 | 3.15 |
Е-Ё | 150757 | 8.47 |
Ж | 34773 | 1.95 |
З | 29645 | 1.67 |
И-Й | 137499 | 7.73 |
К | 62053 | 3.49 |
Л | 89060 | 5.00 |
М | 56418 | 3.17 |
Н | 115445 | 6.49 |
О | 199125 | 11.19 |
П | 47578 | 2.67 |
Р | 82346 | 4.63 |
С | 95353 | 5.36 |
Т | 102735 | 5.77 |
У | 52020 | 2.92 |
Ф | 3591 | 0.20 |
Х | 15570 | 0.87 |
Ц | 7543 | 0.42 |
Ч | 24676 | 1.39 |
Ш | 15373 | 0.86 |
Щ | 7211 | 0.41 |
Ь-Ъ | 32454 | 1.82 |
Ы | 35622 | 2.00 |
Э | 7170 | 0.40 |
Ю | 11350 | 0.64 |
Я | 36079 | 2.03 |
|
Части речи
Определенных частей речи (ОЧР) | 324652 слов |
Не определенных частей речи (НОЧР) | 2662 слов |
Часть речи | Кол-во (шт.) | % в тексте (ОЧР - 100%) |
Сущ. | 97495 | 30.031 |
Глаг. | 30460 | 17.919 |
Мест.-сущ. | 30460 | 9.382 |
Предл. | 26155 | 10.658 |
Союз | 23523 | 7 |
Прилаг. | 26155 | 8.056 |
Нареч. | 15779 | 4.860 |
Местоим-прилаг. | 18025 | 5.552 |
Частица | 12431 | 3.829 |
Местоим. нареч. | 4148 | 1.278 |
Числит. | 2618 | 0.806 |
Числит-прилаг. | 831 | 0.256 |
Междомет. | 392 | 0.121 |
Часть комп. сложн. слова | 19 | 0.006 |
Биграммы частей речи
В таблице показаны частоты словопар типа «сглагол+уществительное», «предлог+прилагательное» и т.д. Частота выражена в среднем количестве пары на 1000 слов текста. Вертикаль отражает часть речи первого слова биграммы, горизонталь — второго.
| Сущ. | Глаг. | Мест.-сущ. | Предл. | Союз | Прилаг. | Нареч. | Местоим-прилаг. | Частица | Местоим. нареч. | Числит. | Числит-прилаг. | Междомет. | Часть комп. сложн. слова |
Сущ. | 70.91 | 63.20 | 22.26 | 38.85 | 36.20 | 20.07 | 14.48 | 16.34 | 9.99 | 4.65 | 1.93 | 0.80 | 0.61 | 0.01 |
Глаг. | 42.48 | 18.61 | 21.06 | 38.55 | 12.50 | 13.69 | 10.39 | 10.05 | 7.32 | 2.48 | 1.46 | 0.38 | 0.23 | 0.00 |
Мест.-сущ. | 17.41 | 31.57 | 5.48 | 6.88 | 6.10 | 6.59 | 7.28 | 3.33 | 6.95 | 1.62 | 0.45 | 0.08 | 0.09 | 0.00 |
Предл. | 52.56 | 1.85 | 18.85 | 0.48 | 0.82 | 13.19 | 0.52 | 15.50 | 0.06 | 0.06 | 1.85 | 0.80 | 0.01 | 0.03 |
Союз | 15.95 | 15.35 | 10.74 | 6.79 | 2.45 | 5.57 | 5.21 | 3.49 | 5.00 | 1.32 | 0.47 | 0.10 | 0.02 | 0.00 |
Прилаг. | 56.00 | 4.21 | 2.14 | 3.42 | 5.30 | 6.09 | 1.07 | 1.07 | 0.79 | 0.26 | 0.12 | 0.05 | 0.05 | 0.01 |
Нареч. | 4.58 | 18.36 | 3.35 | 4.57 | 3.53 | 4.76 | 3.97 | 1.48 | 3.00 | 0.49 | 0.39 | 0.08 | 0.03 | 0.00 |
Местоим-прилаг. | 26.29 | 7.02 | 4.32 | 2.82 | 1.49 | 6.74 | 1.79 | 1.78 | 1.93 | 0.83 | 0.43 | 0.06 | 0.03 | 0.00 |
Частица | 5.89 | 15.35 | 3.72 | 2.94 | 1.87 | 1.85 | 2.31 | 1.85 | 1.44 | 0.75 | 0.27 | 0.02 | 0.02 | 0.01 |
Местоим. нареч. | 1.40 | 2.81 | 1.51 | 0.86 | 1.70 | 0.84 | 1.37 | 0.30 | 1.64 | 0.27 | 0.06 | 0.02 | 0.00 | 0.00 |
Числит. | 5.06 | 0.41 | 0.13 | 0.17 | 0.21 | 0.99 | 0.14 | 0.13 | 0.06 | 0.02 | 0.59 | 0.16 | 0.01 | 0.00 |
Числит-прилаг. | 1.57 | 0.26 | 0.07 | 0.18 | 0.14 | 0.11 | 0.04 | 0.03 | 0.05 | 0.02 | 0.04 | 0.02 | 0.00 | 0.00 |
Междомет. | 0.17 | 0.18 | 0.20 | 0.06 | 0.16 | 0.05 | 0.05 | 0.16 | 0.06 | 0.01 | 0.00 | 0.00 | 0.10 | 0.00 |
Часть комп. сложн. слова | 0.03 | 0.00 | 0.00 | 0.00 | 0.00 | 0.02 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 |
Части речи на позициях в предложении
Таблица показывает, с какой частотой употреблены автором различные части на позициях в предложении. Например, ячейка «глагол – 3» показывает с какой вероятностью третье слово в случайно взятом предложении произведения является глаголом. Вероятность выражена в процентах. В каждом столбце максимальное значение отмечено розовым цветом, что позволяет по первым трём-пяти столбцам примерно представить типичное для произведения начало предлоджения. Например, последовательность «местоимение-существительное, глагол, прилагательное, существительное» может быть чем-то вроде «Он срубил старое дерево...»
| Номер слова в предложении |
| 1 | 2 | 3 | 4 | 5 |
Сущ. | 21.45 | 22.39 | 25.90 | 27.72 | 28.26 |
Глаг. | 9.59 | 26.32 | 23.97 | 20.76 | 19.86 |
Мест.-сущ. | 18.73 | 13.03 | 10.59 | 10.05 | 9.02 |
Предл. | 12.27 | 6.58 | 9.64 | 10.47 | 11.00 |
Союз | 11.30 | 4.16 | 5.13 | 6.39 | 7.12 |
Прилаг. | 4.93 | 5.54 | 6.69 | 7.51 | 8.05 |
Нареч. | 6.45 | 5.96 | 5.71 | 5.08 | 4.81 |
Местоим-прилаг. | 5.84 | 6.42 | 5.00 | 5.70 | 5.67 |
Частица | 4.79 | 6.66 | 5.12 | 4.25 | 4.06 |
Местоим. нареч. | 2.77 | 1.54 | 1.30 | 1.16 | 1.15 |
Числит. | 0.57 | 0.83 | 0.62 | 0.68 | 0.74 |
Числит-прилаг. | 0.27 | 0.46 | 0.25 | 0.20 | 0.20 |
Междомет. | 1.05 | 0.09 | 0.06 | 0.02 | 0.04 |
Часть комп. сложн. слова | 0.01 | 0.00 | 0.01 | 0.00 | 0.02 |
| Номер слова в предложении |
| 6 | 7 | 8 | 9 | 10 |
Сущ. | 28.68 | 29.33 | 29.31 | 29.88 | 29.20 |
Глаг. | 19.43 | 18.13 | 17.61 | 17.25 | 17.35 |
Мест.-сущ. | 8.61 | 8.35 | 8.28 | 8.39 | 8.01 |
Предл. | 11.00 | 11.41 | 11.54 | 11.41 | 11.88 |
Союз | 7.82 | 7.69 | 7.99 | 8.32 | 8.15 |
Прилаг. | 8.36 | 8.86 | 8.60 | 8.86 | 9.14 |
Нареч. | 4.76 | 4.70 | 4.62 | 4.55 | 4.39 |
Местоим-прилаг. | 5.68 | 5.78 | 6.02 | 5.65 | 5.73 |
Частица | 3.47 | 3.55 | 3.94 | 3.36 | 3.86 |
Местоим. нареч. | 1.17 | 1.06 | 1.05 | 1.17 | 1.23 |
Числит. | 0.78 | 0.85 | 0.81 | 0.88 | 0.78 |
Числит-прилаг. | 0.19 | 0.22 | 0.20 | 0.24 | 0.24 |
Междомет. | 0.04 | 0.06 | 0.03 | 0.05 | 0.03 |
Часть комп. сложн. слова | 0.01 | 0.01 | 0.01 | 0.01 | 0.00 |
| Номер слова в предложении |
| 11 | 12 | 13 | 14 | 15 |
Сущ. | 29.21 | 30.12 | 29.55 | 30.54 | 29.66 |
Глаг. | 17.55 | 16.75 | 16.93 | 16.92 | 16.73 |
Мест.-сущ. | 7.88 | 7.56 | 8.38 | 7.63 | 8.11 |
Предл. | 11.92 | 12.11 | 12.14 | 11.60 | 12.51 |
Союз | 8.12 | 8.32 | 8.22 | 8.29 | 7.69 |
Прилаг. | 9.19 | 8.43 | 8.91 | 9.46 | 8.85 |
Нареч. | 4.42 | 4.74 | 4.25 | 4.23 | 4.33 |
Местоим-прилаг. | 5.62 | 5.88 | 5.58 | 5.64 | 5.91 |
Частица | 3.79 | 3.78 | 3.50 | 3.35 | 3.97 |
Местоим. нареч. | 1.15 | 1.22 | 1.11 | 1.25 | 1.14 |
Числит. | 0.91 | 0.82 | 1.11 | 0.84 | 0.81 |
Числит-прилаг. | 0.17 | 0.24 | 0.28 | 0.19 | 0.20 |
Междомет. | 0.06 | 0.04 | 0.06 | 0.05 | 0.06 |
Часть комп. сложн. слова | 0.00 | 0.00 | 0.00 | 0.00 | 0.03 |
Последние комментарии
35 минут 53 секунд назад
1 час 16 минут назад
1 час 17 минут назад
3 часов 17 минут назад
9 часов 23 минут назад
9 часов 34 минут назад