Лингвистический анализ: В дебрях Центральной Азии (записки кладоискателя) (Владимир Обручев)
Общая статистика
Длина текста | 608652 знаков |
Длина диалогов | 109272 знаков |
Слов в произведении (СВП) | 95376 слов |
Приблизительно страниц | 339 стр. |
Средняя длина слова | 5.14 знаков |
Предложений в произведении (ПВП) | 5415 предл. |
Средняя длина предложения (СДП) | 109.47 знаков |
Доля диалогов в тексте | 17.95 % |
Доля авторского текста | 82.05 % |
СДП диалогов | 80.43 знаков |
СДП авторского текста | 122.00 знаков |
|
Максимальный фрагмент авторского текста - 39045 знаков (в страницах - примерно 22, начинается где-то с 223 страницы) |
Активный словарный запас
Использовано уникальных слов | 18044 | |
Активный словарный запас (АСЗ) | 17338 | |
Активный не словарный запас (АНСЗ) | 706 | |
Удельный АСЗ на 3000 слов текста | 1473.84 | 442647 место в рейтинге УАСЗ-3000 |
Удельный АСЗ на 10000 слов текста | 3766.39 | 276804 место в рейтинге УАСЗ-10000 |
Удельный АСЗ на 100000 слов текста | 0.00 | |
|
Максимальный УАСЗ-3000 (1651) наблюдается примерно на 333 странице |
Минимальный УАСЗ-3000 (1320) наблюдается примерно на 18 странице |
|
Буквы и знаки препинания
Всего букв | 490268 букв |
Всего знаков препинания | 18885 знаков |
Знак | Кол-во (шт.) | Средн. кол-во на 1000 слов (шт.) |
, | 11358 | 119.09 |
. | 5410 | 56.72 |
- | 1056 | 11.07 |
? | 248 | 2.60 |
! | 220 | 2.31 |
... | 0 | 0.00 |
!.. | 0 | 0.00 |
?.. | 0 | 0.00 |
!!! | 0 | 0.00 |
?! | 0 | 0.00 |
" | 0 | 0.00 |
() | 62 | 0.65 |
: | 183 | 1.92 |
; | 348 | 3.65 |
Буква | Кол-во (шт.) | Частота использования (в %) |
А | 40182 | 8.20 |
Б | 8645 | 1.76 |
В | 21002 | 4.28 |
Г | 8909 | 1.82 |
Д | 15631 | 3.19 |
Е-Ё | 38382 | 7.83 |
Ж | 8909 | 1.82 |
З | 8417 | 1.72 |
И-Й | 41283 | 8.42 |
К | 18386 | 3.75 |
Л | 24807 | 5.06 |
М | 15492 | 3.16 |
Н | 30632 | 6.25 |
О | 53803 | 10.97 |
П | 13916 | 2.84 |
Р | 22419 | 4.57 |
С | 24604 | 5.02 |
Т | 27157 | 5.54 |
У | 14089 | 2.87 |
Ф | 736 | 0.15 |
Х | 6075 | 1.24 |
Ц | 1412 | 0.29 |
Ч | 7145 | 1.46 |
Ш | 4786 | 0.98 |
Щ | 1707 | 0.35 |
Ь-Ъ | 9619 | 1.96 |
Ы | 12493 | 2.55 |
Э | 1509 | 0.31 |
Ю | 3201 | 0.65 |
Я | 9252 | 1.89 |
|
Части речи
Определенных частей речи (ОЧР) | 95321 слов |
Не определенных частей речи (НОЧР) | 55 слов |
Часть речи | Кол-во (шт.) | % в тексте (ОЧР - 100%) |
Сущ. | 29456 | 30.902 |
Глаг. | 6701 | 16.685 |
Мест.-сущ. | 6701 | 7.030 |
Предл. | 7560 | 12.780 |
Союз | 8235 | 9 |
Прилаг. | 7560 | 7.931 |
Нареч. | 5622 | 5.898 |
Местоим-прилаг. | 4136 | 4.339 |
Частица | 2743 | 2.878 |
Местоим. нареч. | 1636 | 1.716 |
Числит. | 862 | 0.904 |
Числит-прилаг. | 177 | 0.186 |
Междомет. | 44 | 0.046 |
Часть комп. сложн. слова | 63 | 0.066 |
Биграммы частей речи
В таблице показаны частоты словопар типа «сглагол+уществительное», «предлог+прилагательное» и т.д. Частота выражена в среднем количестве пары на 1000 слов текста. Вертикаль отражает часть речи первого слова биграммы, горизонталь — второго.
| Сущ. | Глаг. | Мест.-сущ. | Предл. | Союз | Прилаг. | Нареч. | Местоим-прилаг. | Частица | Местоим. нареч. | Числит. | Числит-прилаг. | Междомет. | Часть комп. сложн. слова |
Сущ. | 67.82 | 55.76 | 18.15 | 55.34 | 47.25 | 18.43 | 15.89 | 13.32 | 7.39 | 6.75 | 2.11 | 0.40 | 0.37 | 0.03 |
Глаг. | 36.78 | 18.10 | 15.98 | 34.72 | 15.23 | 13.05 | 14.95 | 6.97 | 5.73 | 3.48 | 1.65 | 0.21 | 0.00 | 0.00 |
Мест.-сущ. | 10.44 | 27.66 | 2.84 | 6.74 | 4.40 | 3.56 | 6.72 | 1.84 | 4.41 | 1.17 | 0.49 | 0.03 | 0.00 | 0.00 |
Предл. | 74.11 | 1.55 | 13.54 | 0.77 | 0.43 | 18.59 | 0.79 | 13.77 | 0.07 | 0.00 | 2.78 | 0.84 | 0.01 | 0.55 |
Союз | 20.96 | 19.79 | 9.26 | 10.29 | 2.09 | 6.26 | 6.92 | 3.42 | 4.24 | 2.27 | 0.64 | 0.15 | 0.05 | 0.05 |
Прилаг. | 55.96 | 3.43 | 1.35 | 3.86 | 5.74 | 6.00 | 1.25 | 0.62 | 0.69 | 0.35 | 0.03 | 0.02 | 0.00 | 0.01 |
Нареч. | 7.08 | 18.44 | 2.12 | 8.62 | 4.96 | 6.29 | 6.26 | 1.08 | 2.58 | 0.86 | 0.57 | 0.08 | 0.02 | 0.00 |
Местоим-прилаг. | 21.94 | 6.37 | 2.56 | 2.32 | 1.27 | 3.50 | 1.68 | 0.91 | 1.38 | 1.19 | 0.20 | 0.06 | 0.01 | 0.00 |
Частица | 4.09 | 11.75 | 2.00 | 2.92 | 1.08 | 1.87 | 2.41 | 0.81 | 0.91 | 0.69 | 0.19 | 0.04 | 0.00 | 0.01 |
Местоим. нареч. | 2.01 | 3.51 | 2.20 | 1.54 | 3.38 | 0.72 | 1.72 | 0.41 | 1.26 | 0.31 | 0.07 | 0.01 | 0.00 | 0.00 |
Числит. | 5.68 | 0.34 | 0.20 | 0.59 | 0.46 | 0.83 | 0.34 | 0.21 | 0.08 | 0.05 | 0.26 | 0.01 | 0.00 | 0.00 |
Числит-прилаг. | 1.28 | 0.10 | 0.04 | 0.09 | 0.07 | 0.10 | 0.02 | 0.03 | 0.03 | 0.02 | 0.05 | 0.00 | 0.00 | 0.00 |
Междомет. | 0.29 | 0.04 | 0.04 | 0.00 | 0.03 | 0.01 | 0.02 | 0.00 | 0.00 | 0.02 | 0.00 | 0.00 | 0.00 | 0.00 |
Часть комп. сложн. слова | 0.57 | 0.00 | 0.00 | 0.00 | 0.00 | 0.08 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 | 0.01 |
Части речи на позициях в предложении
Таблица показывает, с какой частотой употреблены автором различные части на позициях в предложении. Например, ячейка «глагол – 3» показывает с какой вероятностью третье слово в случайно взятом предложении произведения является глаголом. Вероятность выражена в процентах. В каждом столбце максимальное значение отмечено розовым цветом, что позволяет по первым трём-пяти столбцам примерно представить типичное для произведения начало предлоджения. Например, последовательность «местоимение-существительное, глагол, прилагательное, существительное» может быть чем-то вроде «Он срубил старое дерево...»
| Номер слова в предложении |
| 1 | 2 | 3 | 4 | 5 |
Сущ. | 18.36 | 25.21 | 26.27 | 27.15 | 28.75 |
Глаг. | 10.23 | 24.56 | 22.22 | 20.26 | 20.02 |
Мест.-сущ. | 17.09 | 10.87 | 10.25 | 9.55 | 7.67 |
Предл. | 17.15 | 8.91 | 11.62 | 12.66 | 11.90 |
Союз | 12.48 | 3.82 | 6.04 | 6.82 | 7.60 |
Прилаг. | 3.86 | 5.41 | 5.89 | 7.12 | 7.48 |
Нареч. | 6.67 | 7.93 | 7.00 | 6.78 | 6.14 |
Местоим-прилаг. | 4.61 | 5.43 | 4.15 | 4.11 | 4.13 |
Частица | 4.52 | 4.30 | 3.61 | 2.77 | 3.06 |
Местоим. нареч. | 4.07 | 2.10 | 1.58 | 1.46 | 1.59 |
Числит. | 0.53 | 0.96 | 1.11 | 1.10 | 1.14 |
Числит-прилаг. | 0.38 | 0.44 | 0.25 | 0.16 | 0.29 |
Междомет. | 0.06 | 0.02 | 0.02 | 0.04 | 0.06 |
Часть комп. сложн. слова | 0.00 | 0.06 | 0.00 | 0.04 | 0.17 |
| Номер слова в предложении |
| 6 | 7 | 8 | 9 | 10 |
Сущ. | 31.33 | 30.62 | 30.70 | 32.06 | 30.68 |
Глаг. | 16.99 | 16.72 | 16.46 | 16.53 | 16.29 |
Мест.-сущ. | 5.90 | 6.47 | 6.42 | 5.68 | 5.98 |
Предл. | 13.16 | 12.80 | 13.55 | 12.68 | 14.00 |
Союз | 8.81 | 9.37 | 9.81 | 10.07 | 9.01 |
Прилаг. | 8.05 | 8.70 | 8.31 | 8.56 | 8.07 |
Нареч. | 5.25 | 5.92 | 5.40 | 5.04 | 5.38 |
Местоим-прилаг. | 4.29 | 3.94 | 4.29 | 4.14 | 4.72 |
Частица | 3.40 | 2.68 | 2.58 | 2.58 | 2.37 |
Местоим. нареч. | 1.46 | 1.58 | 1.23 | 1.44 | 2.06 |
Числит. | 1.01 | 0.95 | 1.07 | 0.89 | 1.13 |
Числит-прилаг. | 0.17 | 0.18 | 0.14 | 0.10 | 0.21 |
Междомет. | 0.09 | 0.05 | 0.00 | 0.10 | 0.08 |
Часть комп. сложн. слова | 0.09 | 0.05 | 0.05 | 0.12 | 0.03 |
| Номер слова в предложении |
| 11 | 12 | 13 | 14 | 15 |
Сущ. | 30.26 | 31.28 | 30.86 | 31.80 | 30.55 |
Глаг. | 16.91 | 15.61 | 16.13 | 14.91 | 16.07 |
Мест.-сущ. | 6.21 | 6.26 | 5.54 | 5.21 | 5.16 |
Предл. | 13.21 | 13.52 | 13.40 | 14.20 | 13.21 |
Союз | 10.06 | 8.79 | 9.73 | 9.70 | 10.54 |
Прилаг. | 7.94 | 8.40 | 7.98 | 9.64 | 8.31 |
Нареч. | 5.38 | 5.48 | 5.86 | 4.87 | 6.01 |
Местоим-прилаг. | 4.71 | 5.03 | 4.44 | 4.26 | 5.31 |
Частица | 2.59 | 2.74 | 3.26 | 2.83 | 2.67 |
Местоим. нареч. | 1.62 | 1.85 | 1.84 | 1.43 | 1.15 |
Числит. | 1.00 | 0.71 | 0.73 | 0.78 | 0.78 |
Числит-прилаг. | 0.06 | 0.18 | 0.10 | 0.07 | 0.07 |
Междомет. | 0.00 | 0.09 | 0.03 | 0.17 | 0.00 |
Часть комп. сложн. слова | 0.06 | 0.06 | 0.10 | 0.14 | 0.15 |
Последние комментарии
10 часов 18 минут назад
17 часов 28 минут назад
18 часов 35 минут назад
19 часов 40 минут назад
20 часов 3 минут назад
20 часов 8 минут назад