Лингвистический анализ: Восстановление данных на 100% (Петр Ташков)
Общая статистика
Длина текста | 353342 знаков |
Длина диалогов | 6522 знаков |
Слов в произведении (СВП) | 46240 слов |
Приблизительно страниц | 197 стр. |
Средняя длина слова | 6.35 знаков |
Предложений в произведении (ПВП) | 3157 предл. |
Средняя длина предложения (СДП) | 108.94 знаков |
Доля диалогов в тексте | 1.85 % |
Доля авторского текста | 98.15 % |
СДП диалогов | 122.08 знаков |
СДП авторского текста | 87.59 знаков |
|
Максимальный фрагмент авторского текста - 90347 знаков (в страницах - примерно 50, начинается где-то с 72 страницы) |
Активный словарный запас
Использовано уникальных слов | 9580 | |
Активный словарный запас (АСЗ) | 8614 | |
Активный не словарный запас (АНСЗ) | 966 | |
Удельный АСЗ на 3000 слов текста | 1408.91 | 470298 место в рейтинге УАСЗ-3000 |
Удельный АСЗ на 10000 слов текста | 3458.30 | 409483 место в рейтинге УАСЗ-10000 |
Удельный АСЗ на 100000 слов текста | 0.00 | |
|
Максимальный УАСЗ-3000 (1647) наблюдается примерно на 166 странице |
Минимальный УАСЗ-3000 (1225) наблюдается примерно на 76 странице |
|
Буквы и знаки препинания
Всего букв | 278099 букв |
Всего знаков препинания | 8776 знаков |
Знак | Кол-во (шт.) | Средн. кол-во на 1000 слов (шт.) |
, | 3097 | 66.98 |
. | 3903 | 84.41 |
- | 641 | 13.86 |
? | 7 | 0.15 |
! | 31 | 0.67 |
... | 0 | 0.00 |
!.. | 0 | 0.00 |
?.. | 0 | 0.00 |
!!! | 0 | 0.00 |
?! | 0 | 0.00 |
" | 0 | 0.00 |
() | 653 | 14.12 |
: | 310 | 6.70 |
; | 134 | 2.90 |
Буква | Кол-во (шт.) | Частота использования (в %) |
А | 23061 | 8.29 |
Б | 3709 | 1.33 |
В | 11893 | 4.28 |
Г | 3250 | 1.17 |
Д | 8315 | 2.99 |
Е-Ё | 22876 | 8.23 |
Ж | 3250 | 1.17 |
З | 4701 | 1.69 |
И-Й | 26123 | 9.39 |
К | 9687 | 3.48 |
Л | 10254 | 3.69 |
М | 9188 | 3.30 |
Н | 19415 | 6.98 |
О | 29370 | 10.56 |
П | 8973 | 3.23 |
Р | 14967 | 5.38 |
С | 16267 | 5.85 |
Т | 18357 | 6.60 |
У | 5088 | 1.83 |
Ф | 1755 | 0.63 |
Х | 3215 | 1.16 |
Ц | 1362 | 0.49 |
Ч | 3617 | 1.30 |
Ш | 1040 | 0.37 |
Щ | 860 | 0.31 |
Ь-Ъ | 4233 | 1.52 |
Ы | 5958 | 2.14 |
Э | 815 | 0.29 |
Ю | 1776 | 0.64 |
Я | 5504 | 1.98 |
|
Части речи
Определенных частей речи (ОЧР) | 43060 слов |
Не определенных частей речи (НОЧР) | 3180 слов |
Часть речи | Кол-во (шт.) | % в тексте (ОЧР - 100%) |
Сущ. | 16726 | 38.843 |
Глаг. | 1354 | 14.301 |
Мест.-сущ. | 1354 | 3.144 |
Предл. | 4441 | 12.120 |
Союз | 3088 | 7 |
Прилаг. | 4441 | 10.314 |
Нареч. | 2541 | 5.901 |
Местоим-прилаг. | 1906 | 4.426 |
Частица | 859 | 1.995 |
Местоим. нареч. | 297 | 0.690 |
Числит. | 326 | 0.757 |
Числит-прилаг. | 138 | 0.320 |
Междомет. | 5 | 0.012 |
Часть комп. сложн. слова | 2 | 0.005 |
Биграммы частей речи
В таблице показаны частоты словопар типа «сглагол+уществительное», «предлог+прилагательное» и т.д. Частота выражена в среднем количестве пары на 1000 слов текста. Вертикаль отражает часть речи первого слова биграммы, горизонталь — второго.
| Сущ. | Глаг. | Мест.-сущ. | Предл. | Союз | Прилаг. | Нареч. | Местоим-прилаг. | Частица | Местоим. нареч. | Числит. | Числит-прилаг. | Междомет. | Часть комп. сложн. слова |
Сущ. | 126.71 | 60.59 | 8.45 | 63.89 | 44.24 | 32.23 | 26.41 | 15.49 | 5.43 | 3.34 | 0.95 | 0.56 | 0.07 | 0.05 |
Глаг. | 46.03 | 17.16 | 3.83 | 29.26 | 9.10 | 15.49 | 9.17 | 6.29 | 3.44 | 0.81 | 2.00 | 0.39 | 0.02 | 0.00 |
Мест.-сущ. | 9.08 | 6.62 | 0.58 | 2.18 | 2.67 | 3.20 | 3.92 | 0.70 | 2.11 | 0.12 | 0.16 | 0.09 | 0.00 | 0.00 |
Предл. | 61.57 | 4.60 | 11.40 | 1.16 | 0.93 | 22.04 | 1.37 | 13.75 | 0.09 | 0.09 | 2.55 | 1.63 | 0.02 | 0.00 |
Союз | 23.39 | 12.77 | 2.51 | 8.13 | 2.44 | 8.59 | 6.34 | 3.76 | 2.58 | 0.46 | 0.44 | 0.30 | 0.00 | 0.00 |
Прилаг. | 80.68 | 4.27 | 0.88 | 3.65 | 5.06 | 5.88 | 1.02 | 0.65 | 0.56 | 0.30 | 0.12 | 0.07 | 0.00 | 0.00 |
Нареч. | 5.41 | 23.25 | 1.95 | 5.92 | 3.55 | 7.39 | 5.39 | 1.81 | 2.65 | 1.05 | 0.56 | 0.09 | 0.00 | 0.00 |
Местоим-прилаг. | 24.85 | 4.20 | 1.02 | 3.62 | 1.35 | 4.64 | 2.07 | 0.63 | 1.46 | 0.05 | 0.30 | 0.07 | 0.00 | 0.00 |
Частица | 3.41 | 7.34 | 0.44 | 2.53 | 0.39 | 1.72 | 1.97 | 0.88 | 0.65 | 0.39 | 0.21 | 0.00 | 0.00 | 0.00 |
Местоим. нареч. | 0.51 | 1.76 | 0.26 | 0.44 | 1.21 | 0.35 | 1.14 | 0.14 | 0.86 | 0.23 | 0.00 | 0.00 | 0.00 | 0.00 |
Числит. | 4.60 | 0.28 | 0.09 | 0.19 | 0.60 | 1.30 | 0.16 | 0.16 | 0.05 | 0.02 | 0.12 | 0.00 | 0.00 | 0.00 |
Числит-прилаг. | 2.16 | 0.16 | 0.02 | 0.19 | 0.09 | 0.28 | 0.05 | 0.00 | 0.07 | 0.02 | 0.16 | 0.00 | 0.00 | 0.00 |
Междомет. | 0.00 | 0.00 | 0.00 | 0.05 | 0.07 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 |
Часть комп. сложн. слова | 0.02 | 0.00 | 0.00 | 0.00 | 0.00 | 0.02 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 |
Части речи на позициях в предложении
Таблица показывает, с какой частотой употреблены автором различные части на позициях в предложении. Например, ячейка «глагол – 3» показывает с какой вероятностью третье слово в случайно взятом предложении произведения является глаголом. Вероятность выражена в процентах. В каждом столбце максимальное значение отмечено розовым цветом, что позволяет по первым трём-пяти столбцам примерно представить типичное для произведения начало предлоджения. Например, последовательность «местоимение-существительное, глагол, прилагательное, существительное» может быть чем-то вроде «Он срубил старое дерево...»
| Номер слова в предложении |
| 1 | 2 | 3 | 4 | 5 |
Сущ. | 26.10 | 45.98 | 44.60 | 35.84 | 38.06 |
Глаг. | 10.09 | 11.18 | 16.07 | 18.31 | 17.98 |
Мест.-сущ. | 4.58 | 5.71 | 2.71 | 2.60 | 2.06 |
Предл. | 25.20 | 7.30 | 10.36 | 12.80 | 11.19 |
Союз | 8.20 | 3.39 | 5.02 | 5.61 | 5.48 |
Прилаг. | 8.27 | 11.32 | 8.23 | 10.05 | 10.89 |
Нареч. | 8.83 | 4.44 | 6.57 | 6.49 | 6.19 |
Местоим-прилаг. | 6.11 | 6.70 | 3.50 | 4.44 | 4.05 |
Частица | 0.66 | 1.90 | 1.81 | 2.38 | 2.21 |
Местоим. нареч. | 1.33 | 0.71 | 0.33 | 0.48 | 0.60 |
Числит. | 0.27 | 0.56 | 0.61 | 0.81 | 1.01 |
Числит-прилаг. | 0.37 | 0.81 | 0.18 | 0.18 | 0.26 |
Междомет. | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 |
Часть комп. сложн. слова | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 |
| Номер слова в предложении |
| 6 | 7 | 8 | 9 | 10 |
Сущ. | 36.94 | 38.23 | 38.09 | 37.41 | 37.79 |
Глаг. | 16.55 | 15.27 | 14.96 | 15.24 | 14.01 |
Мест.-сущ. | 2.39 | 2.19 | 2.73 | 2.90 | 2.54 |
Предл. | 11.96 | 10.61 | 12.95 | 10.93 | 11.82 |
Союз | 6.78 | 7.45 | 7.88 | 8.25 | 8.98 |
Прилаг. | 10.82 | 10.94 | 9.50 | 10.66 | 10.84 |
Нареч. | 5.92 | 5.91 | 5.79 | 5.26 | 5.91 |
Местоим-прилаг. | 4.98 | 4.25 | 4.69 | 4.31 | 3.91 |
Частица | 2.27 | 2.27 | 1.62 | 2.63 | 2.20 |
Местоим. нареч. | 0.55 | 1.13 | 0.72 | 0.82 | 0.78 |
Числит. | 0.55 | 1.42 | 0.64 | 1.13 | 1.03 |
Числит-прилаг. | 0.24 | 0.24 | 0.38 | 0.45 | 0.15 |
Междомет. | 0.00 | 0.08 | 0.04 | 0.00 | 0.05 |
Часть комп. сложн. слова | 0.04 | 0.00 | 0.00 | 0.00 | 0.00 |
| Номер слова в предложении |
| 11 | 12 | 13 | 14 | 15 |
Сущ. | 34.17 | 36.69 | 36.99 | 35.00 | 38.20 |
Глаг. | 15.46 | 14.86 | 12.88 | 13.97 | 13.18 |
Мест.-сущ. | 3.52 | 3.17 | 2.93 | 3.25 | 4.18 |
Предл. | 13.43 | 12.56 | 14.03 | 12.07 | 11.37 |
Союз | 8.37 | 9.16 | 8.74 | 10.37 | 8.60 |
Прилаг. | 10.61 | 10.94 | 10.71 | 11.43 | 12.08 |
Нареч. | 6.08 | 4.84 | 4.91 | 5.15 | 4.50 |
Местоим-прилаг. | 3.94 | 3.74 | 4.72 | 4.94 | 3.55 |
Частица | 2.29 | 2.02 | 2.49 | 1.98 | 2.68 |
Местоим. нареч. | 0.69 | 0.86 | 0.57 | 0.49 | 0.71 |
Числит. | 1.07 | 0.86 | 0.70 | 1.06 | 0.39 |
Числит-прилаг. | 0.37 | 0.29 | 0.32 | 0.28 | 0.55 |
Междомет. | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 |
Часть комп. сложн. слова | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 |
Последние комментарии
3 часов 37 минут назад
12 часов 29 минут назад
12 часов 32 минут назад
2 дней 18 часов назад
2 дней 23 часов назад
3 дней 1 час назад