Лингвистический анализ: BIG DATA. Вся технология в одной книге (Андреас Вайгенд)
Общая статистика
Длина текста | 726236 знаков |
Длина диалогов | 0 знаков |
Слов в произведении (СВП) | 96075 слов |
Приблизительно страниц | 404 стр. |
Средняя длина слова | 6.18 знаков |
Предложений в произведении (ПВП) | 5364 предл. |
Средняя длина предложения (СДП) | 132.44 знаков |
Доля диалогов в тексте | 0.00 % |
Доля авторского текста | 100 % |
СДП диалогов | 0.00 знаков |
СДП авторского текста | 119.08 знаков |
Активный словарный запас
Использовано уникальных слов | 22045 | |
Активный словарный запас (АСЗ) | 17497 | |
Активный не словарный запас (АНСЗ) | 4548 | |
Удельный АСЗ на 3000 слов текста | 1596.89 | 126108 место в рейтинге УАСЗ-3000 |
Удельный АСЗ на 10000 слов текста | 4187.82 | 103483 место в рейтинге УАСЗ-10000 |
Удельный АСЗ на 100000 слов текста | 0.00 | |
|
Максимальный УАСЗ-3000 (1726) наблюдается примерно на 59 странице |
Минимальный УАСЗ-3000 (1437) наблюдается примерно на 391 странице |
|
Буквы и знаки препинания
Всего букв | 516864 букв |
Всего знаков препинания | 20161 знаков |
Знак | Кол-во (шт.) | Средн. кол-во на 1000 слов (шт.) |
, | 10160 | 105.75 |
. | 6177 | 64.29 |
- | 2180 | 22.69 |
? | 296 | 3.08 |
! | 23 | 0.24 |
... | 0 | 0.00 |
!.. | 0 | 0.00 |
?.. | 0 | 0.00 |
!!! | 0 | 0.00 |
?! | 0 | 0.00 |
" | 0 | 0.00 |
() | 396 | 4.12 |
: | 809 | 8.42 |
; | 120 | 1.25 |
Буква | Кол-во (шт.) | Частота использования (в %) |
А | 38833 | 7.51 |
Б | 7876 | 1.52 |
В | 22845 | 4.42 |
Г | 6844 | 1.32 |
Д | 14889 | 2.88 |
Е-Ё | 43517 | 8.42 |
Ж | 6844 | 1.32 |
З | 9187 | 1.78 |
И-Й | 48594 | 9.40 |
К | 15266 | 2.95 |
Л | 20462 | 3.96 |
М | 17675 | 3.42 |
Н | 36167 | 7.00 |
О | 57781 | 11.18 |
П | 15434 | 2.99 |
Р | 24310 | 4.70 |
С | 26651 | 5.16 |
Т | 34579 | 6.69 |
У | 11131 | 2.15 |
Ф | 2703 | 0.52 |
Х | 5637 | 1.09 |
Ц | 3767 | 0.73 |
Ч | 7631 | 1.48 |
Ш | 2706 | 0.52 |
Щ | 2092 | 0.40 |
Ь-Ъ | 9693 | 1.88 |
Ы | 10460 | 2.02 |
Э | 1796 | 0.35 |
Ю | 3959 | 0.77 |
Я | 9957 | 1.93 |
|
Части речи
Определенных частей речи (ОЧР) | 81872 слов |
Не определенных частей речи (НОЧР) | 14203 слов |
Часть речи | Кол-во (шт.) | % в тексте (ОЧР - 100%) |
Сущ. | 29553 | 36.097 |
Глаг. | 4891 | 15.017 |
Мест.-сущ. | 4891 | 5.974 |
Предл. | 7514 | 12.596 |
Союз | 6420 | 8 |
Прилаг. | 7514 | 9.178 |
Нареч. | 3805 | 4.647 |
Местоим-прилаг. | 4082 | 4.986 |
Частица | 2002 | 2.445 |
Местоим. нареч. | 491 | 0.600 |
Числит. | 355 | 0.434 |
Числит-прилаг. | 127 | 0.155 |
Междомет. | 19 | 0.023 |
Часть комп. сложн. слова | 5 | 0.006 |
Биграммы частей речи
В таблице показаны частоты словопар типа «сглагол+уществительное», «предлог+прилагательное» и т.д. Частота выражена в среднем количестве пары на 1000 слов текста. Вертикаль отражает часть речи первого слова биграммы, горизонталь — второго.
| Сущ. | Глаг. | Мест.-сущ. | Предл. | Союз | Прилаг. | Нареч. | Местоим-прилаг. | Частица | Местоим. нареч. | Числит. | Числит-прилаг. | Междомет. | Часть комп. сложн. слова |
Сущ. | 104.36 | 59.41 | 13.99 | 68.07 | 43.52 | 28.65 | 16.40 | 17.09 | 5.80 | 2.25 | 0.88 | 0.37 | 0.16 | 0.01 |
Глаг. | 42.11 | 18.86 | 9.65 | 30.02 | 12.36 | 13.52 | 7.80 | 8.98 | 5.26 | 0.73 | 0.60 | 0.23 | 0.02 | 0.01 |
Мест.-сущ. | 12.03 | 18.35 | 2.72 | 3.98 | 6.85 | 4.13 | 5.47 | 1.62 | 3.90 | 0.55 | 0.12 | 0.01 | 0.00 | 0.00 |
Предл. | 69.74 | 3.15 | 15.28 | 1.01 | 1.32 | 17.70 | 1.64 | 13.66 | 0.22 | 0.13 | 1.42 | 0.64 | 0.04 | 0.02 |
Союз | 22.49 | 14.60 | 9.00 | 8.00 | 3.11 | 7.26 | 5.04 | 4.37 | 3.54 | 0.65 | 0.26 | 0.10 | 0.00 | 0.00 |
Прилаг. | 70.89 | 4.21 | 0.99 | 4.09 | 3.95 | 5.24 | 0.75 | 0.66 | 0.51 | 0.28 | 0.18 | 0.01 | 0.00 | 0.01 |
Нареч. | 4.32 | 16.07 | 2.53 | 4.12 | 3.90 | 6.80 | 4.70 | 1.11 | 2.05 | 0.50 | 0.29 | 0.06 | 0.01 | 0.00 |
Местоим-прилаг. | 27.04 | 4.59 | 3.14 | 3.51 | 1.44 | 5.84 | 1.82 | 1.06 | 0.98 | 0.13 | 0.18 | 0.12 | 0.00 | 0.00 |
Частица | 3.13 | 9.47 | 1.48 | 2.36 | 0.93 | 1.71 | 2.24 | 1.12 | 1.21 | 0.62 | 0.18 | 0.01 | 0.00 | 0.00 |
Местоим. нареч. | 0.66 | 1.27 | 0.77 | 0.45 | 0.90 | 0.27 | 0.46 | 0.11 | 0.95 | 0.15 | 0.00 | 0.00 | 0.00 | 0.00 |
Числит. | 2.98 | 0.10 | 0.06 | 0.23 | 0.13 | 0.45 | 0.15 | 0.04 | 0.01 | 0.00 | 0.18 | 0.00 | 0.00 | 0.00 |
Числит-прилаг. | 1.03 | 0.07 | 0.07 | 0.11 | 0.00 | 0.20 | 0.00 | 0.02 | 0.01 | 0.00 | 0.04 | 0.00 | 0.00 | 0.00 |
Междомет. | 0.12 | 0.02 | 0.06 | 0.01 | 0.00 | 0.00 | 0.00 | 0.01 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 |
Часть комп. сложн. слова | 0.05 | 0.00 | 0.00 | 0.00 | 0.00 | 0.01 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 |
Части речи на позициях в предложении
Таблица показывает, с какой частотой употреблены автором различные части на позициях в предложении. Например, ячейка «глагол – 3» показывает с какой вероятностью третье слово в случайно взятом предложении произведения является глаголом. Вероятность выражена в процентах. В каждом столбце максимальное значение отмечено розовым цветом, что позволяет по первым трём-пяти столбцам примерно представить типичное для произведения начало предлоджения. Например, последовательность «местоимение-существительное, глагол, прилагательное, существительное» может быть чем-то вроде «Он срубил старое дерево...»
| Номер слова в предложении |
| 1 | 2 | 3 | 4 | 5 |
Сущ. | 23.00 | 33.20 | 34.05 | 34.01 | 36.57 |
Глаг. | 7.52 | 18.04 | 21.07 | 20.83 | 18.34 |
Мест.-сущ. | 9.08 | 9.64 | 6.02 | 5.12 | 5.30 |
Предл. | 21.33 | 9.66 | 10.73 | 11.88 | 11.74 |
Союз | 13.90 | 4.44 | 5.97 | 5.71 | 6.11 |
Прилаг. | 6.14 | 7.27 | 7.60 | 9.39 | 8.85 |
Нареч. | 8.38 | 5.24 | 5.41 | 4.56 | 4.69 |
Местоим-прилаг. | 6.95 | 5.82 | 4.25 | 4.74 | 5.11 |
Частица | 1.19 | 4.76 | 3.60 | 2.82 | 2.46 |
Местоим. нареч. | 1.67 | 0.90 | 0.63 | 0.28 | 0.26 |
Числит. | 0.31 | 0.51 | 0.44 | 0.54 | 0.45 |
Числит-прилаг. | 0.51 | 0.51 | 0.23 | 0.12 | 0.07 |
Междомет. | 0.02 | 0.02 | 0.00 | 0.00 | 0.05 |
Часть комп. сложн. слова | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 |
| Номер слова в предложении |
| 6 | 7 | 8 | 9 | 10 |
Сущ. | 35.23 | 36.58 | 36.33 | 35.46 | 36.16 |
Глаг. | 17.10 | 16.23 | 16.28 | 15.21 | 14.32 |
Мест.-сущ. | 4.58 | 4.45 | 4.78 | 5.69 | 5.84 |
Предл. | 12.78 | 12.73 | 11.93 | 12.94 | 12.75 |
Союз | 6.78 | 7.11 | 7.54 | 7.64 | 8.82 |
Прилаг. | 10.13 | 9.41 | 9.94 | 10.16 | 9.64 |
Нареч. | 4.75 | 4.62 | 4.33 | 4.30 | 4.14 |
Местоим-прилаг. | 4.80 | 5.16 | 5.35 | 4.73 | 5.02 |
Частица | 2.51 | 2.35 | 2.29 | 2.55 | 2.10 |
Местоим. нареч. | 0.65 | 0.56 | 0.50 | 0.57 | 0.58 |
Числит. | 0.60 | 0.66 | 0.52 | 0.46 | 0.50 |
Числит-прилаг. | 0.05 | 0.10 | 0.12 | 0.26 | 0.11 |
Междомет. | 0.02 | 0.02 | 0.07 | 0.03 | 0.00 |
Часть комп. сложн. слова | 0.02 | 0.02 | 0.00 | 0.00 | 0.00 |
| Номер слова в предложении |
| 11 | 12 | 13 | 14 | 15 |
Сущ. | 36.11 | 34.86 | 33.64 | 34.12 | 35.48 |
Глаг. | 14.64 | 15.07 | 15.46 | 14.23 | 14.59 |
Мест.-сущ. | 5.83 | 6.30 | 5.89 | 5.99 | 6.24 |
Предл. | 12.57 | 12.86 | 12.23 | 13.58 | 13.06 |
Союз | 8.46 | 8.66 | 8.48 | 8.59 | 9.11 |
Прилаг. | 10.03 | 10.61 | 10.58 | 10.79 | 9.32 |
Нареч. | 4.17 | 3.60 | 5.22 | 4.28 | 3.81 |
Местоим-прилаг. | 4.78 | 4.43 | 4.79 | 4.89 | 5.27 |
Частица | 2.04 | 2.21 | 2.62 | 2.82 | 2.18 |
Местоим. нареч. | 0.66 | 0.60 | 0.43 | 0.39 | 0.49 |
Числит. | 0.41 | 0.60 | 0.49 | 0.23 | 0.38 |
Числит-прилаг. | 0.19 | 0.14 | 0.15 | 0.03 | 0.03 |
Междомет. | 0.06 | 0.03 | 0.03 | 0.03 | 0.03 |
Часть комп. сложн. слова | 0.03 | 0.03 | 0.00 | 0.03 | 0.00 |
Последние комментарии
6 часов 20 минут назад
22 часов 24 минут назад
1 день 7 часов назад
1 день 7 часов назад
3 дней 13 часов назад
3 дней 18 часов назад