Лингвистический анализ: Холодный дом (Чарльз Диккенс)
Общая статистика
Длина текста | 2057613 знаков |
Длина диалогов | 916730 знаков |
Слов в произведении (СВП) | 323238 слов |
Приблизительно страниц | 1144 стр. |
Средняя длина слова | 5.04 знаков |
Предложений в произведении (ПВП) | 17676 предл. |
Средняя длина предложения (СДП) | 113.60 знаков |
Доля диалогов в тексте | 44.55 % |
Доля авторского текста | 55.45 % |
СДП диалогов | 102.46 знаков |
СДП авторского текста | 164.99 знаков |
|
Максимальный фрагмент авторского текста - 17736 знаков (в страницах - примерно 10, начинается где-то с 1 страницы) |
Активный словарный запас
Использовано уникальных слов | 40365 | |
Активный словарный запас (АСЗ) | 39621 | |
Активный не словарный запас (АНСЗ) | 744 | |
Удельный АСЗ на 3000 слов текста | 1376.91 | 143136 место в рейтинге УАСЗ-3000 |
Удельный АСЗ на 10000 слов текста | 3577.99 | 179229 место в рейтинге УАСЗ-10000 |
Удельный АСЗ на 100000 слов текста | 19369.22 | 45613 место в рейтинге УАСЗ-100000 |
|
Максимальный УАСЗ-3000 (1618) наблюдается примерно на 7 странице |
Минимальный УАСЗ-3000 (1134) наблюдается примерно на 782 странице |
|
Буквы и знаки препинания
Всего букв | 1629560 букв |
Всего знаков препинания | 74309 знаков |
Знак | Кол-во (шт.) | Средн. кол-во на 1000 слов (шт.) |
, | 47336 | 146.44 |
. | 15640 | 48.39 |
- | 3349 | 10.36 |
? | 2284 | 7.07 |
! | 2693 | 8.33 |
... | 0 | 0.00 |
!.. | 44 | 0.14 |
?.. | 21 | 0.06 |
!!! | 0 | 0.00 |
?! | 3 | 0.01 |
" | 0 | 0.00 |
() | 538 | 1.66 |
: | 942 | 2.91 |
; | 1459 | 4.51 |
Буква | Кол-во (шт.) | Частота использования (в %) |
А | 127370 | 7.82 |
Б | 26180 | 1.61 |
В | 69435 | 4.26 |
Г | 29056 | 1.78 |
Д | 55791 | 3.42 |
Е-Ё | 144339 | 8.86 |
Ж | 29056 | 1.78 |
З | 24825 | 1.52 |
И-Й | 125164 | 7.68 |
К | 56311 | 3.46 |
Л | 72131 | 4.43 |
М | 60371 | 3.70 |
Н | 103651 | 6.36 |
О | 180946 | 11.10 |
П | 42625 | 2.62 |
Р | 69764 | 4.28 |
С | 91258 | 5.60 |
Т | 107613 | 6.60 |
У | 45533 | 2.79 |
Ф | 1376 | 0.08 |
Х | 13146 | 0.81 |
Ц | 4483 | 0.28 |
Ч | 26718 | 1.64 |
Ш | 12925 | 0.79 |
Щ | 4912 | 0.30 |
Ь-Ъ | 33111 | 2.03 |
Ы | 28142 | 1.73 |
Э | 6747 | 0.41 |
Ю | 10042 | 0.62 |
Я | 36839 | 2.26 |
|
Части речи
Определенных частей речи (ОЧР) | 323103 слов |
Не определенных частей речи (НОЧР) | 135 слов |
Часть речи | Кол-во (шт.) | % в тексте (ОЧР - 100%) |
Сущ. | 74326 | 23.004 |
Глаг. | 39851 | 18.455 |
Мест.-сущ. | 39851 | 12.334 |
Предл. | 20556 | 9.354 |
Союз | 33327 | 10 |
Прилаг. | 20556 | 6.362 |
Нареч. | 20263 | 6.271 |
Местоим-прилаг. | 18632 | 5.767 |
Частица | 17017 | 5.267 |
Местоим. нареч. | 6849 | 2.120 |
Числит. | 1712 | 0.530 |
Числит-прилаг. | 323 | 0.100 |
Междомет. | 390 | 0.121 |
Часть комп. сложн. слова | 3 | 0.001 |
Биграммы частей речи
В таблице показаны частоты словопар типа «сглагол+уществительное», «предлог+прилагательное» и т.д. Частота выражена в среднем количестве пары на 1000 слов текста. Вертикаль отражает часть речи первого слова биграммы, горизонталь — второго.
| Сущ. | Глаг. | Мест.-сущ. | Предл. | Союз | Прилаг. | Нареч. | Местоим-прилаг. | Частица | Местоим. нареч. | Числит. | Числит-прилаг. | Междомет. | Часть комп. сложн. слова |
Сущ. | 46.94 | 43.73 | 17.87 | 26.75 | 42.38 | 10.23 | 12.57 | 13.63 | 9.43 | 5.01 | 0.93 | 0.21 | 0.36 | 0.00 |
Глаг. | 35.21 | 20.02 | 28.31 | 35.21 | 21.62 | 8.85 | 10.59 | 10.41 | 9.14 | 4.05 | 0.83 | 0.10 | 0.21 | 0.00 |
Мест.-сущ. | 15.08 | 37.88 | 8.22 | 9.63 | 11.06 | 7.27 | 13.00 | 5.17 | 11.27 | 3.95 | 0.63 | 0.06 | 0.13 | 0.00 |
Предл. | 39.84 | 1.24 | 22.77 | 0.38 | 1.21 | 10.45 | 0.66 | 15.32 | 0.06 | 0.11 | 0.99 | 0.42 | 0.07 | 0.00 |
Союз | 14.10 | 21.37 | 22.57 | 7.21 | 4.87 | 5.26 | 9.32 | 5.31 | 9.02 | 3.55 | 0.45 | 0.06 | 0.04 | 0.01 |
Прилаг. | 40.07 | 4.21 | 2.04 | 2.58 | 6.17 | 4.12 | 1.17 | 1.63 | 0.97 | 0.45 | 0.14 | 0.02 | 0.05 | 0.00 |
Нареч. | 3.92 | 23.23 | 5.57 | 4.44 | 6.80 | 5.15 | 5.97 | 1.36 | 4.75 | 1.19 | 0.28 | 0.02 | 0.04 | 0.00 |
Местоим-прилаг. | 25.05 | 5.89 | 5.91 | 1.97 | 2.43 | 7.98 | 2.47 | 2.23 | 2.24 | 1.05 | 0.34 | 0.07 | 0.04 | 0.00 |
Частица | 4.72 | 21.85 | 6.46 | 3.91 | 3.11 | 2.36 | 4.22 | 1.92 | 2.65 | 1.19 | 0.27 | 0.02 | 0.00 | 0.00 |
Местоим. нареч. | 1.25 | 4.47 | 3.20 | 1.20 | 2.94 | 1.57 | 2.54 | 0.41 | 2.96 | 0.59 | 0.04 | 0.00 | 0.01 | 0.00 |
Числит. | 3.08 | 0.42 | 0.22 | 0.17 | 0.33 | 0.32 | 0.15 | 0.12 | 0.06 | 0.02 | 0.40 | 0.01 | 0.00 | 0.00 |
Числит-прилаг. | 0.52 | 0.11 | 0.07 | 0.06 | 0.11 | 0.02 | 0.01 | 0.02 | 0.05 | 0.02 | 0.01 | 0.00 | 0.00 | 0.00 |
Междомет. | 0.22 | 0.14 | 0.13 | 0.03 | 0.12 | 0.03 | 0.05 | 0.14 | 0.06 | 0.03 | 0.00 | 0.00 | 0.24 | 0.00 |
Часть комп. сложн. слова | 0.01 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 |
Части речи на позициях в предложении
Таблица показывает, с какой частотой употреблены автором различные части на позициях в предложении. Например, ячейка «глагол – 3» показывает с какой вероятностью третье слово в случайно взятом предложении произведения является глаголом. Вероятность выражена в процентах. В каждом столбце максимальное значение отмечено розовым цветом, что позволяет по первым трём-пяти столбцам примерно представить типичное для произведения начало предлоджения. Например, последовательность «местоимение-существительное, глагол, прилагательное, существительное» может быть чем-то вроде «Он срубил старое дерево...»
| Номер слова в предложении |
| 1 | 2 | 3 | 4 | 5 |
Сущ. | 14.72 | 19.15 | 20.35 | 22.10 | 24.27 |
Глаг. | 10.83 | 21.94 | 23.26 | 23.12 | 21.17 |
Мест.-сущ. | 19.53 | 17.35 | 14.77 | 13.37 | 12.17 |
Предл. | 7.31 | 5.85 | 7.15 | 8.32 | 9.43 |
Союз | 18.69 | 5.86 | 7.15 | 7.91 | 8.90 |
Прилаг. | 3.05 | 4.12 | 5.37 | 5.56 | 6.08 |
Нареч. | 7.99 | 7.56 | 7.26 | 6.08 | 5.85 |
Местоим-прилаг. | 4.00 | 5.72 | 5.18 | 5.29 | 5.48 |
Частица | 8.73 | 8.95 | 6.76 | 5.52 | 4.22 |
Местоим. нареч. | 3.76 | 2.57 | 2.08 | 1.94 | 1.79 |
Числит. | 0.34 | 0.42 | 0.43 | 0.62 | 0.53 |
Числит-прилаг. | 0.09 | 0.19 | 0.08 | 0.10 | 0.06 |
Междомет. | 0.95 | 0.31 | 0.15 | 0.06 | 0.05 |
Часть комп. сложн. слова | 0.00 | 0.00 | 0.00 | 0.01 | 0.00 |
| Номер слова в предложении |
| 6 | 7 | 8 | 9 | 10 |
Сущ. | 24.63 | 23.61 | 23.63 | 22.92 | 22.71 |
Глаг. | 19.46 | 19.28 | 18.42 | 17.88 | 18.11 |
Мест.-сущ. | 11.52 | 11.95 | 11.35 | 12.26 | 11.57 |
Предл. | 9.62 | 9.38 | 9.80 | 10.08 | 10.21 |
Союз | 9.78 | 10.03 | 10.44 | 11.32 | 11.15 |
Прилаг. | 6.12 | 6.50 | 6.83 | 6.17 | 6.30 |
Нареч. | 6.50 | 6.28 | 5.98 | 5.96 | 6.22 |
Местоим-прилаг. | 5.72 | 5.83 | 5.55 | 5.76 | 6.00 |
Частица | 4.35 | 4.55 | 5.03 | 4.96 | 5.06 |
Местоим. нареч. | 1.64 | 1.94 | 2.09 | 1.95 | 1.97 |
Числит. | 0.56 | 0.54 | 0.70 | 0.58 | 0.54 |
Числит-прилаг. | 0.05 | 0.07 | 0.13 | 0.09 | 0.09 |
Междомет. | 0.05 | 0.05 | 0.05 | 0.06 | 0.07 |
Часть комп. сложн. слова | 0.01 | 0.00 | 0.00 | 0.00 | 0.00 |
| Номер слова в предложении |
| 11 | 12 | 13 | 14 | 15 |
Сущ. | 22.58 | 23.11 | 22.02 | 22.68 | 21.80 |
Глаг. | 18.47 | 17.42 | 18.24 | 17.59 | 17.73 |
Мест.-сущ. | 11.54 | 11.75 | 11.33 | 11.66 | 11.60 |
Предл. | 10.18 | 10.29 | 10.39 | 10.22 | 10.78 |
Союз | 10.70 | 11.45 | 11.18 | 11.47 | 10.98 |
Прилаг. | 6.67 | 6.59 | 6.70 | 6.54 | 7.14 |
Нареч. | 6.20 | 5.92 | 6.09 | 6.28 | 6.28 |
Местоим-прилаг. | 5.98 | 5.95 | 5.89 | 5.84 | 6.17 |
Частица | 4.81 | 4.85 | 5.34 | 5.07 | 4.68 |
Местоим. нареч. | 2.07 | 2.05 | 2.02 | 2.08 | 2.11 |
Числит. | 0.68 | 0.47 | 0.66 | 0.40 | 0.54 |
Числит-прилаг. | 0.09 | 0.05 | 0.12 | 0.09 | 0.11 |
Междомет. | 0.04 | 0.09 | 0.03 | 0.07 | 0.09 |
Часть комп. сложн. слова | 0.00 | 0.01 | 0.00 | 0.00 | 0.00 |
Последние комментарии
7 часов 56 минут назад
11 часов 45 минут назад
12 часов 3 минут назад
12 часов 9 минут назад
12 часов 24 минут назад
13 часов 57 минут назад