Лингвистический анализ: В поисках утраченных предков (сборник) (Дмитрий Каралис)


- В поисках утраченных предков (сборник) (и.с. Лучшая проза из Портфеля «Литературной газеты») 2.12 Мб, 612с. скачать: (fb2) (исправленную)  читать: (полностью)  - Дмитрий Николаевич Каралис

Общая статистика

Длина текста1100710 знаков
Длина диалогов235124 знаков
Слов в произведении (СВП)165878 слов
Приблизительно страниц612 стр.
Средняя длина слова5.29 знаков
Предложений в произведении (ПВП)11932 предл.
Средняя длина предложения (СДП)89.44 знаков
Доля диалогов в тексте21.36 %
Доля авторского текста78.64 %
СДП диалогов71.35 знаков
СДП авторского текста105.58 знаков
Использование диалогов по тексту книги № 275118: В поисках утраченных предков (сборник) (Дмитрий Каралис)
Максимальный фрагмент авторского текста - 34255 знаков (в страницах - примерно 19, начинается где-то с 622 страницы)

Активный словарный запас

Использовано уникальных слов38434
Активный словарный запас (АСЗ)37388
Активный не словарный запас (АНСЗ)1046
Удельный АСЗ на 3000 слов текста1663.40247543 место в рейтинге УАСЗ-3000
Удельный АСЗ на 10000 слов текста4566.43227095 место в рейтинге УАСЗ-10000
Удельный АСЗ на 100000 слов текста27101.9035050 место в рейтинге УАСЗ-100000
Удельный АСЗ-3000 книги № 275118: В поисках утраченных предков (сборник) (Дмитрий Каралис)
Максимальный УАСЗ-3000 (1908) наблюдается примерно на 442 странице
Минимальный УАСЗ-3000 (1470) наблюдается примерно на 251 странице
Рост АСЗ книги № 275118: В поисках утраченных предков (сборник) (Дмитрий Каралис)

Буквы и знаки препинания

Всего букв877242 букв
Всего знаков препинания36522 знаков

ЗнакКол-во (шт.)Средн. кол-во на 1000 слов (шт.)
, 18787113.26
. 1099866.30
- 16539.97
? 15449.31
! 185311.17
... 00.00
!.. 960.58
?.. 960.58
!!! 00.00
?! 60.04
" 00.00
() 1620.98
: 12037.25
; 1240.75
БукваКол-во (шт.)Частота использования (в %)
А757168.63
Б140891.61
В385854.40
Г149121.70
Д291083.32
Е-Ё709108.08
Ж149121.70
З147271.68
И-Й733088.36
К347673.96
Л425734.85
М293293.34
Н535446.10
О9241810.54
П255322.91
Р405024.62
С467175.33
Т512455.84
У255032.91
Ф23220.26
Х77920.89
Ц42280.48
Ч122111.39
Ш77830.89
Щ27860.32
Ь-Ъ158131.80
Ы158851.81
Э16330.19
Ю53430.61
Я193302.20
Диаграма использования букв книги № 275118: В поисках утраченных предков (сборник) (Дмитрий Каралис)

Части речи

Определенных частей речи (ОЧР)165644 слов
Не определенных частей речи (НОЧР)234 слов

Часть речиКол-во (шт.)% в тексте (ОЧР - 100%)
Сущ.5036430.405
Глаг.1360318.912
Мест.-сущ.136038.212
Предл.1283511.635
Союз143859
Прилаг.128357.749
Нареч.79944.826
Местоим-прилаг.57073.445
Частица59443.588
Местоим. нареч.21151.277
Числит.13660.825
Числит-прилаг.5200.314
Междомет.1760.106
Часть комп.
сложн. слова
350.021

Биграммы частей речи

В таблице показаны частоты словопар типа «сглагол+уществительное», «предлог+прилагательное» и т.д. Частота выражена в среднем количестве пары на 1000 слов текста. Вертикаль отражает часть речи первого слова биграммы, горизонталь — второго.

Сущ.Глаг.Мест.-сущ.Предл.СоюзПрилаг.Нареч.Местоим-прилаг.ЧастицаМестоим. нареч.Числит.Числит-прилаг.Междомет.Часть комп.
сложн. слова
Сущ.70.7262.4419.9145.8246.2618.7114.129.089.584.062.030.730.520.06
Глаг.47.9021.7318.7842.1119.6912.999.465.936.312.351.260.400.190.01
Мест.-сущ.11.3729.184.648.524.854.527.732.576.471.530.570.140.030.00
Предл.66.772.0413.020.490.7919.081.019.570.070.012.251.110.040.10
Союз15.8524.6912.677.063.085.166.743.195.222.480.530.140.010.01
Прилаг.56.333.761.452.293.647.350.930.530.690.270.160.050.040.01
Нареч.4.8720.203.774.503.952.613.251.102.950.500.490.050.030.00
Местоим-прилаг.17.323.982.551.521.034.161.420.561.120.510.180.100.010.01
Частица4.0017.332.852.551.621.432.341.271.520.720.190.020.030.00
Местоим. нареч.1.253.022.031.071.390.461.070.451.680.270.070.020.000.00
Числит.5.220.290.210.240.290.750.110.160.150.020.460.340.000.00
Числит-прилаг.2.040.270.130.130.150.180.040.010.050.030.050.040.010.00
Междомет.0.280.190.110.050.110.010.040.040.050.010.000.000.160.00
Часть комп.
сложн. слова
0.120.000.000.000.000.080.000.000.000.000.000.000.000.01

Части речи на позициях в предложении

Таблица показывает, с какой частотой употреблены автором различные части на позициях в предложении. Например, ячейка «глагол – 3» показывает с какой вероятностью третье слово в случайно взятом предложении произведения является глаголом. Вероятность выражена в процентах. В каждом столбце максимальное значение отмечено розовым цветом, что позволяет по первым трём-пяти столбцам примерно представить типичное для произведения начало предлоджения. Например, последовательность «местоимение-существительное, глагол, прилагательное, существительное» может быть чем-то вроде «Он срубил старое дерево...»

Номер слова в предложении
12345
Сущ.21.1820.9825.9829.4430.10
Глаг.11.7125.6222.3421.1920.01
Мест.-сущ.16.8912.0010.628.727.21
Предл.9.668.5011.5911.3612.32
Союз14.965.886.987.148.21
Прилаг.4.255.655.697.388.06
Нареч.7.287.375.534.954.80
Местоим-прилаг.3.254.013.763.663.59
Частица6.296.464.683.533.51
Местоим. нареч.2.622.131.441.250.96
Числит.0.900.910.930.880.89
Числит-прилаг.0.420.400.330.430.27
Междомет.0.590.100.100.070.04
Часть комп.
сложн. слова
0.020.000.020.000.02

Номер слова в предложении
678910
Сущ.30.8731.5631.0030.0330.83
Глаг.20.2518.5717.9819.4917.90
Мест.-сущ.7.076.846.826.717.06
Предл.12.3312.2012.5713.5513.40
Союз8.749.099.609.198.35
Прилаг.8.108.458.698.198.57
Нареч.4.244.534.434.024.56
Местоим-прилаг.3.423.413.443.183.78
Частица3.112.853.133.433.07
Местоим. нареч.0.811.091.061.021.20
Числит.0.770.880.890.830.97
Числит-прилаг.0.200.440.310.310.22
Междомет.0.070.070.080.030.05
Часть комп.
сложн. слова
0.010.010.000.020.05

Номер слова в предложении
1112131415
Сущ.31.4629.7132.6329.4830.57
Глаг.18.3418.7318.3618.5718.28
Мест.-сущ.7.137.057.467.076.45
Предл.12.9613.5912.7412.9213.13
Союз9.279.888.4210.099.14
Прилаг.8.138.777.898.469.27
Нареч.3.853.223.954.004.23
Местоим-прилаг.3.313.753.333.383.67
Частица3.113.462.893.523.04
Местоим. нареч.0.980.731.231.290.92
Числит.0.890.730.880.810.87
Числит-прилаг.0.480.280.150.260.29
Междомет.0.090.100.040.070.05
Часть комп.
сложн. слова
0.000.000.020.070.08