Лингвистический анализ: Лопухи и лебеда (Андрей Смирнов)


- Лопухи и лебеда (и.с. corpus [вне подсерий]-377) 9.99 Мб, 461с. скачать: (fb2) (исправленную)  читать: (полностью)  - Андрей Сергеевич Смирнов

Общая статистика

Длина текста829413 знаков
Длина диалогов324564 знаков
Слов в произведении (СВП)126874 слов
Приблизительно страниц461 стр.
Средняя длина слова5.10 знаков
Предложений в произведении (ПВП)15606 предл.
Средняя длина предложения (СДП)50.38 знаков
Доля диалогов в тексте39.13 %
Доля авторского текста60.87 %
СДП диалогов72.65 знаков
СДП авторского текста56.60 знаков
Использование диалогов по тексту книги № 350702: Лопухи и лебеда (Андрей Смирнов)
Максимальный фрагмент авторского текста - 119558 знаков (в страницах - примерно 66, начинается где-то с 217 страницы)

Активный словарный запас

Использовано уникальных слов29798
Активный словарный запас (АСЗ)28210
Активный не словарный запас (АНСЗ)1588
Удельный АСЗ на 3000 слов текста1597.95263988 место в рейтинге УАСЗ-3000
Удельный АСЗ на 10000 слов текста4312.63100151 место в рейтинге УАСЗ-10000
Удельный АСЗ на 100000 слов текста25281.70284 место в рейтинге УАСЗ-100000
Удельный АСЗ-3000 книги № 350702: Лопухи и лебеда (Андрей Смирнов)
Максимальный УАСЗ-3000 (1948) наблюдается примерно на 338 странице
Минимальный УАСЗ-3000 (1103) наблюдается примерно на 232 странице
Рост АСЗ книги № 350702: Лопухи и лебеда (Андрей Смирнов)

Буквы и знаки препинания

Всего букв647235 букв
Всего знаков препинания34741 знаков

ЗнакКол-во (шт.)Средн. кол-во на 1000 слов (шт.)
, 14964117.94
. 13169103.80
- 133810.55
? 255820.16
! 169213.34
... 00.00
!.. 370.29
?.. 140.11
!!! 10.01
?! 50.04
" 00.00
() 1070.84
: 8526.72
; 40.03
БукваКол-во (шт.)Частота использования (в %)
А612319.46
Б110051.70
В290864.49
Г111561.72
Д200193.09
Е-Ё522368.07
Ж111561.72
З111191.72
И-Й474467.33
К257703.98
Л293314.53
М191692.96
Н386085.97
О6491510.03
П184232.85
Р307664.75
С348735.39
Т408686.31
У220133.40
Ф11520.18
Х59100.91
Ц25970.40
Ч86861.34
Ш67311.04
Щ18800.29
Ь-Ъ131392.03
Ы118761.83
Э11720.18
Ю39810.62
Я155992.41
Диаграма использования букв книги № 350702: Лопухи и лебеда (Андрей Смирнов)

Части речи

Определенных частей речи (ОЧР)126723 слов
Не определенных частей речи (НОЧР)151 слов

Часть речиКол-во (шт.)% в тексте (ОЧР - 100%)
Сущ.3806630.039
Глаг.1310421.008
Мест.-сущ.1310410.341
Предл.695311.221
Союз86927
Прилаг.69535.487
Нареч.60904.806
Местоим-прилаг.41773.296
Частица54464.298
Местоим. нареч.17331.368
Числит.8340.658
Числит-прилаг.5650.446
Междомет.2120.167
Часть комп.
сложн. слова
100.008

Биграммы частей речи

В таблице показаны частоты словопар типа «сглагол+уществительное», «предлог+прилагательное» и т.д. Частота выражена в среднем количестве пары на 1000 слов текста. Вертикаль отражает часть речи первого слова биграммы, горизонталь — второго.

Сущ.Глаг.Мест.-сущ.Предл.СоюзПрилаг.Нареч.Местоим-прилаг.ЧастицаМестоим. нареч.Числит.Числит-прилаг.Междомет.Часть комп.
сложн. слова
Сущ.66.2181.1826.1940.4529.7314.1314.289.5111.213.711.701.360.710.02
Глаг.63.0725.6523.3740.8719.1510.1510.195.346.832.721.141.100.490.01
Мест.-сущ.14.8532.919.6710.145.114.668.894.099.552.690.560.210.080.00
Предл.73.202.1215.690.770.9410.980.405.860.090.011.390.660.060.05
Союз14.7316.2611.595.832.162.864.362.625.522.130.290.180.050.00
Прилаг.33.245.212.192.683.384.481.100.960.950.350.120.140.070.00
Нареч.6.5418.394.584.423.592.213.141.242.830.470.360.200.090.00
Местоим-прилаг.13.325.262.832.111.232.712.041.041.600.530.190.070.030.00
Частица5.6919.014.213.311.501.722.491.682.270.720.230.110.040.00
Местоим. нареч.1.933.062.381.091.200.410.840.501.840.280.090.050.000.00
Числит.3.510.530.220.360.320.360.190.060.110.050.500.370.000.00
Числит-прилаг.3.570.280.150.100.070.090.090.020.060.000.020.010.000.00
Междомет.0.470.210.340.060.210.080.060.050.110.020.000.000.060.00
Часть комп.
сложн. слова
0.040.010.000.000.000.020.000.000.000.000.000.000.000.01

Части речи на позициях в предложении

Таблица показывает, с какой частотой употреблены автором различные части на позициях в предложении. Например, ячейка «глагол – 3» показывает с какой вероятностью третье слово в случайно взятом предложении произведения является глаголом. Вероятность выражена в процентах. В каждом столбце максимальное значение отмечено розовым цветом, что позволяет по первым трём-пяти столбцам примерно представить типичное для произведения начало предлоджения. Например, последовательность «местоимение-существительное, глагол, прилагательное, существительное» может быть чем-то вроде «Он срубил старое дерево...»

Номер слова в предложении
12345
Сущ.24.7522.7225.0328.4528.32
Глаг.12.3026.0722.7123.3824.04
Мест.-сущ.17.5814.6812.1610.029.45
Предл.11.018.8313.0411.8412.06
Союз12.464.335.635.556.76
Прилаг.3.063.664.545.415.82
Нареч.5.246.615.604.644.26
Местоим-прилаг.3.153.743.273.453.30
Частица5.206.435.504.733.80
Местоим. нареч.2.441.931.431.381.03
Числит.0.530.480.690.730.70
Числит-прилаг.1.580.390.300.370.27
Междомет.0.690.120.090.060.17
Часть комп.
сложн. слова
0.010.010.020.000.01

Номер слова в предложении
678910
Сущ.28.7928.4229.6730.5531.81
Глаг.21.8021.5820.8219.9518.91
Мест.-сущ.8.878.869.068.217.61
Предл.13.2013.6212.9413.5212.98
Союз7.737.007.587.177.49
Прилаг.5.755.946.506.877.07
Нареч.4.364.443.863.914.22
Местоим-прилаг.3.243.373.333.053.29
Частица3.794.464.024.374.49
Местоим. нареч.1.291.081.341.211.10
Числит.0.750.820.630.880.49
Числит-прилаг.0.290.270.180.290.32
Междомет.0.130.130.070.020.22
Часть комп.
сложн. слова
0.000.000.000.000.00

Номер слова в предложении
1112131415
Сущ.29.5330.1530.3231.1326.75
Глаг.20.5120.0819.2718.1819.21
Мест.-сущ.8.547.578.258.888.45
Предл.13.5813.6814.0513.3713.67
Союз8.257.377.787.498.93
Прилаг.6.336.576.366.528.02
Нареч.3.754.274.074.264.41
Местоим-прилаг.3.383.404.153.844.52
Частица4.044.473.714.164.09
Местоим. нареч.1.171.331.221.110.91
Числит.0.600.670.670.650.59
Числит-прилаг.0.200.270.160.280.27
Междомет.0.110.170.000.140.16
Часть комп.
сложн. слова
0.000.000.000.000.00