Лингвистический анализ: Как сделать детектив (Дэшил Хэммет)
Общая статистика
Длина текста | 728266 знаков |
Длина диалогов | 20201 знаков |
Слов в произведении (СВП) | 102410 слов |
Приблизительно страниц | 405 стр. |
Средняя длина слова | 5.81 знаков |
Предложений в произведении (ПВП) | 6551 предл. |
Средняя длина предложения (СДП) | 108.23 знаков |
Доля диалогов в тексте | 2.77 % |
Доля авторского текста | 97.23 % |
СДП диалогов | 88.79 знаков |
СДП авторского текста | 117.42 знаков |
|
Максимальный фрагмент авторского текста - 153290 знаков (в страницах - примерно 85, начинается где-то с 331 страницы) |
Активный словарный запас
Использовано уникальных слов | 25215 | |
Активный словарный запас (АСЗ) | 24146 | |
Активный не словарный запас (АНСЗ) | 1069 | |
Удельный АСЗ на 3000 слов текста | 1664.89 | 131865 место в рейтинге УАСЗ-3000 |
Удельный АСЗ на 10000 слов текста | 4461.86 | 650 место в рейтинге УАСЗ-10000 |
Удельный АСЗ на 100000 слов текста | 24822.67 | 48219 место в рейтинге УАСЗ-100000 |
|
Максимальный УАСЗ-3000 (1881) наблюдается примерно на 395 странице |
Минимальный УАСЗ-3000 (1504) наблюдается примерно на 225 странице |
|
Буквы и знаки препинания
Всего букв | 594537 букв |
Всего знаков препинания | 21580 знаков |
Знак | Кол-во (шт.) | Средн. кол-во на 1000 слов (шт.) |
, | 12737 | 124.37 |
. | 6249 | 61.02 |
- | 922 | 9.00 |
? | 309 | 3.02 |
! | 135 | 1.32 |
... | 0 | 0.00 |
!.. | 4 | 0.04 |
?.. | 3 | 0.03 |
!!! | 1 | 0.01 |
?! | 2 | 0.02 |
" | 0 | 0.00 |
() | 489 | 4.77 |
: | 567 | 5.54 |
; | 162 | 1.58 |
Буква | Кол-во (шт.) | Частота использования (в %) |
А | 44981 | 7.57 |
Б | 9250 | 1.56 |
В | 26203 | 4.41 |
Г | 9220 | 1.55 |
Д | 17889 | 3.01 |
Е-Ё | 54109 | 9.10 |
Ж | 9220 | 1.55 |
З | 9442 | 1.59 |
И-Й | 51905 | 8.73 |
К | 19970 | 3.36 |
Л | 24560 | 4.13 |
М | 19709 | 3.32 |
Н | 40445 | 6.80 |
О | 63785 | 10.73 |
П | 16257 | 2.73 |
Р | 27568 | 4.64 |
С | 32344 | 5.44 |
Т | 42177 | 7.09 |
У | 14405 | 2.42 |
Ф | 1380 | 0.23 |
Х | 5571 | 0.94 |
Ц | 2373 | 0.40 |
Ч | 9140 | 1.54 |
Ш | 3706 | 0.62 |
Щ | 2380 | 0.40 |
Ь-Ъ | 10356 | 1.74 |
Ы | 11754 | 1.98 |
Э | 2036 | 0.34 |
Ю | 4413 | 0.74 |
Я | 11061 | 1.86 |
|
Части речи
Определенных частей речи (ОЧР) | 102184 слов |
Не определенных частей речи (НОЧР) | 226 слов |
Часть речи | Кол-во (шт.) | % в тексте (ОЧР - 100%) |
Сущ. | 32265 | 31.575 |
Глаг. | 7811 | 15.178 |
Мест.-сущ. | 7811 | 7.644 |
Предл. | 10085 | 10.426 |
Союз | 8874 | 9 |
Прилаг. | 10085 | 9.869 |
Нареч. | 5399 | 5.284 |
Местоим-прилаг. | 5232 | 5.120 |
Частица | 4015 | 3.929 |
Местоим. нареч. | 1357 | 1.328 |
Числит. | 613 | 0.600 |
Числит-прилаг. | 308 | 0.301 |
Междомет. | 57 | 0.056 |
Часть комп. сложн. слова | 5 | 0.005 |
Биграммы частей речи
В таблице показаны частоты словопар типа «сглагол+уществительное», «предлог+прилагательное» и т.д. Частота выражена в среднем количестве пары на 1000 слов текста. Вертикаль отражает часть речи первого слова биграммы, горизонталь — второго.
| Сущ. | Глаг. | Мест.-сущ. | Предл. | Союз | Прилаг. | Нареч. | Местоим-прилаг. | Частица | Местоим. нареч. | Числит. | Числит-прилаг. | Междомет. | Часть комп. сложн. слова |
Сущ. | 85.15 | 50.58 | 19.11 | 42.27 | 43.72 | 26.05 | 16.20 | 15.75 | 9.10 | 5.26 | 1.20 | 0.99 | 0.37 | 0.01 |
Глаг. | 36.44 | 16.52 | 13.44 | 31.40 | 12.61 | 14.32 | 8.30 | 9.10 | 6.46 | 1.69 | 1.06 | 0.40 | 0.02 | 0.01 |
Мест.-сущ. | 12.60 | 23.19 | 3.29 | 5.52 | 6.68 | 6.41 | 7.32 | 2.48 | 7.28 | 1.29 | 0.23 | 0.12 | 0.02 | 0.00 |
Предл. | 51.06 | 2.10 | 15.37 | 0.71 | 1.20 | 16.60 | 1.17 | 12.91 | 0.27 | 0.08 | 1.71 | 1.02 | 0.02 | 0.02 |
Союз | 20.31 | 13.59 | 11.22 | 8.37 | 4.63 | 8.01 | 7.50 | 4.56 | 6.18 | 1.74 | 0.49 | 0.20 | 0.05 | 0.01 |
Прилаг. | 69.95 | 4.72 | 2.06 | 3.90 | 7.05 | 7.07 | 1.48 | 0.98 | 0.96 | 0.38 | 0.10 | 0.04 | 0.02 | 0.00 |
Нареч. | 4.37 | 17.53 | 3.51 | 4.28 | 4.52 | 7.89 | 4.47 | 1.63 | 3.38 | 0.84 | 0.33 | 0.05 | 0.03 | 0.00 |
Местоим-прилаг. | 23.60 | 5.31 | 3.92 | 2.93 | 1.97 | 6.98 | 1.94 | 1.58 | 1.93 | 0.65 | 0.28 | 0.12 | 0.00 | 0.00 |
Частица | 5.29 | 15.21 | 2.57 | 3.57 | 1.64 | 3.12 | 3.09 | 1.65 | 1.78 | 1.14 | 0.17 | 0.04 | 0.01 | 0.00 |
Местоим. нареч. | 1.32 | 2.51 | 1.62 | 0.78 | 2.36 | 1.15 | 1.16 | 0.30 | 1.83 | 0.20 | 0.02 | 0.02 | 0.00 | 0.00 |
Числит. | 3.80 | 0.25 | 0.14 | 0.22 | 0.26 | 0.60 | 0.17 | 0.16 | 0.03 | 0.01 | 0.34 | 0.03 | 0.00 | 0.00 |
Числит-прилаг. | 1.68 | 0.24 | 0.15 | 0.15 | 0.13 | 0.45 | 0.02 | 0.07 | 0.06 | 0.01 | 0.06 | 0.00 | 0.00 | 0.00 |
Междомет. | 0.15 | 0.02 | 0.03 | 0.17 | 0.06 | 0.02 | 0.02 | 0.04 | 0.04 | 0.00 | 0.00 | 0.00 | 0.02 | 0.00 |
Часть комп. сложн. слова | 0.01 | 0.00 | 0.00 | 0.00 | 0.00 | 0.04 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 |
Части речи на позициях в предложении
Таблица показывает, с какой частотой употреблены автором различные части на позициях в предложении. Например, ячейка «глагол – 3» показывает с какой вероятностью третье слово в случайно взятом предложении произведения является глаголом. Вероятность выражена в процентах. В каждом столбце максимальное значение отмечено розовым цветом, что позволяет по первым трём-пяти столбцам примерно представить типичное для произведения начало предлоджения. Например, последовательность «местоимение-существительное, глагол, прилагательное, существительное» может быть чем-то вроде «Он срубил старое дерево...»
| Номер слова в предложении |
| 1 | 2 | 3 | 4 | 5 |
Сущ. | 20.63 | 27.43 | 27.92 | 30.04 | 30.23 |
Глаг. | 9.10 | 17.67 | 20.39 | 18.02 | 17.77 |
Мест.-сущ. | 13.19 | 10.53 | 8.36 | 8.19 | 7.11 |
Предл. | 13.57 | 7.02 | 9.42 | 9.85 | 10.62 |
Союз | 14.93 | 6.39 | 5.77 | 6.57 | 7.72 |
Прилаг. | 5.94 | 7.97 | 8.83 | 9.95 | 10.79 |
Нареч. | 8.35 | 6.49 | 6.33 | 5.67 | 5.01 |
Местоим-прилаг. | 5.73 | 6.54 | 5.14 | 5.32 | 4.90 |
Частица | 4.37 | 6.95 | 5.23 | 4.13 | 3.69 |
Местоим. нареч. | 2.99 | 1.68 | 1.49 | 1.25 | 1.13 |
Числит. | 0.46 | 0.66 | 0.54 | 0.78 | 0.70 |
Числит-прилаг. | 0.58 | 0.66 | 0.54 | 0.19 | 0.27 |
Междомет. | 0.17 | 0.02 | 0.03 | 0.03 | 0.04 |
Часть комп. сложн. слова | 0.00 | 0.00 | 0.00 | 0.00 | 0.02 |
| Номер слова в предложении |
| 6 | 7 | 8 | 9 | 10 |
Сущ. | 31.41 | 30.70 | 31.19 | 31.27 | 30.48 |
Глаг. | 16.14 | 15.54 | 14.97 | 14.61 | 15.39 |
Мест.-сущ. | 7.14 | 7.22 | 7.15 | 7.05 | 6.98 |
Предл. | 11.10 | 11.48 | 10.52 | 10.16 | 10.98 |
Союз | 8.19 | 8.46 | 8.42 | 9.56 | 9.24 |
Прилаг. | 10.24 | 11.39 | 11.02 | 10.64 | 10.74 |
Нареч. | 5.19 | 5.25 | 5.59 | 5.33 | 5.01 |
Местоим-прилаг. | 5.12 | 4.90 | 5.14 | 5.42 | 4.77 |
Частица | 3.26 | 3.28 | 4.12 | 3.75 | 3.50 |
Местоим. нареч. | 1.33 | 0.87 | 1.02 | 1.32 | 1.60 |
Числит. | 0.64 | 0.69 | 0.60 | 0.57 | 0.92 |
Числит-прилаг. | 0.23 | 0.22 | 0.25 | 0.31 | 0.38 |
Междомет. | 0.00 | 0.02 | 0.02 | 0.00 | 0.02 |
Часть комп. сложн. слова | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 |
| Номер слова в предложении |
| 11 | 12 | 13 | 14 | 15 |
Сущ. | 30.80 | 29.77 | 28.34 | 30.54 | 30.45 |
Глаг. | 14.26 | 15.06 | 15.35 | 15.52 | 15.19 |
Мест.-сущ. | 7.18 | 6.77 | 7.96 | 6.65 | 6.31 |
Предл. | 10.20 | 11.96 | 10.64 | 11.40 | 11.24 |
Союз | 9.05 | 8.93 | 9.97 | 9.09 | 9.52 |
Прилаг. | 10.97 | 11.37 | 10.72 | 10.90 | 10.30 |
Нареч. | 4.76 | 5.24 | 5.03 | 5.00 | 5.57 |
Местоим-прилаг. | 6.11 | 5.05 | 5.58 | 4.78 | 5.33 |
Частица | 4.21 | 3.82 | 4.14 | 3.78 | 3.81 |
Местоим. нареч. | 1.32 | 1.07 | 1.29 | 1.50 | 1.15 |
Числит. | 0.82 | 0.75 | 0.83 | 0.66 | 0.78 |
Числит-прилаг. | 0.27 | 0.16 | 0.14 | 0.16 | 0.30 |
Междомет. | 0.02 | 0.03 | 0.00 | 0.03 | 0.03 |
Часть комп. сложн. слова | 0.00 | 0.03 | 0.00 | 0.00 | 0.00 |
Последние комментарии
5 часов 15 минут назад
5 часов 35 минут назад
6 часов 1 минута назад
6 часов 4 минут назад
15 часов 35 минут назад
15 часов 38 минут назад