Лингвистический анализ: Блокада Ленинграда. Дневники 1941-1944 годов ( Сборник)


- Блокада Ленинграда. Дневники 1941-1944 годов [litres] (и.с. Блокада Ленинграда. Воспоминания) 3.38 Мб, 606с. скачать: (fb2) (исправленную)  читать: (полностью)  - Сборник - В. М. Давид

Общая статистика

Длина текста1089632 знаков
Длина диалогов30564 знаков
Слов в произведении (СВП)159968 слов
Приблизительно страниц606 стр.
Средняя длина слова5.42 знаков
Предложений в произведении (ПВП)17758 предл.
Средняя длина предложения (СДП)58.40 знаков
Доля диалогов в тексте2.80 %
Доля авторского текста97.2 %
СДП диалогов60.13 знаков
СДП авторского текста61.70 знаков
Использование диалогов по тексту книги № 665801: Блокада Ленинграда. Дневники 1941-1944 годов ( Сборник)
Максимальный фрагмент авторского текста - 156457 знаков (в страницах - примерно 87, начинается где-то с 537 страницы)

Активный словарный запас

Использовано уникальных слов31167
Активный словарный запас (АСЗ)30270
Активный не словарный запас (АНСЗ)897
Удельный АСЗ на 3000 слов текста1595.25438080 место в рейтинге УАСЗ-3000
Удельный АСЗ на 10000 слов текста4235.13386870 место в рейтинге УАСЗ-10000
Удельный АСЗ на 100000 слов текста22965.2759613 место в рейтинге УАСЗ-100000
Удельный АСЗ-3000 книги № 665801: Блокада Ленинграда. Дневники 1941-1944 годов ( Сборник)
Максимальный УАСЗ-3000 (1865) наблюдается примерно на 579 странице
Минимальный УАСЗ-3000 (1263) наблюдается примерно на 148 странице
Рост АСЗ книги № 665801: Блокада Ленинграда. Дневники 1941-1944 годов ( Сборник)

Буквы и знаки препинания

Всего букв864501 букв
Всего знаков препинания37908 знаков

ЗнакКол-во (шт.)Средн. кол-во на 1000 слов (шт.)
, 1495893.51
. 17656110.37
- 187311.71
? 3362.10
! 4843.03
... 00.00
!.. 20.01
?.. 00.00
!!! 40.03
?! 160.10
" 00.00
() 4112.57
: 7924.95
; 13768.60
БукваКол-во (шт.)Частота использования (в %)
А726018.40
Б159401.84
В403334.67
Г159591.85
Д296923.43
Е-Ё705948.17
Ж159591.85
З136671.58
И-Й703278.13
К280903.25
Л393584.55
М263723.05
Н570476.60
О9728411.25
П245092.84
Р426494.93
С443055.12
Т507075.87
У225992.61
Ф17950.21
Х88931.03
Ц36960.43
Ч125931.46
Ш68790.80
Щ33840.39
Ь-Ъ152741.77
Ы161531.87
Э19350.22
Ю54770.63
Я178132.06
Диаграма использования букв книги № 665801: Блокада Ленинграда. Дневники 1941-1944 годов ( Сборник)

Части речи

Определенных частей речи (ОЧР)158133 слов
Не определенных частей речи (НОЧР)1835 слов

Часть речиКол-во (шт.)% в тексте (ОЧР - 100%)
Сущ.5499434.777
Глаг.922116.852
Мест.-сущ.92215.831
Предл.1255812.325
Союз119688
Прилаг.125587.941
Нареч.84955.372
Местоим-прилаг.57793.655
Частица53663.393
Местоим. нареч.17401.100
Числит.12240.774
Числит-прилаг.5000.316
Междомет.1240.078
Часть комп.
сложн. слова
250.016

Биграммы частей речи

В таблице показаны частоты словопар типа «сглагол+уществительное», «предлог+прилагательное» и т.д. Частота выражена в среднем количестве пары на 1000 слов текста. Вертикаль отражает часть речи первого слова биграммы, горизонталь — второго.

Сущ.Глаг.Мест.-сущ.Предл.СоюзПрилаг.Нареч.Местоим-прилаг.ЧастицаМестоим. нареч.Числит.Числит-прилаг.Междомет.Часть комп.
сложн. слова
Сущ.105.8063.7414.9156.0338.0725.1916.8110.3610.183.641.720.820.420.08
Глаг.40.7821.0210.7037.7616.0613.3011.907.365.232.261.620.440.080.03
Мест.-сущ.8.3220.173.095.553.743.375.761.575.291.010.350.080.030.01
Предл.77.062.3511.631.880.9915.990.728.820.200.062.221.260.060.02
Союз19.2314.928.586.982.945.416.683.744.451.970.480.220.070.02
Прилаг.57.493.971.102.944.575.981.370.700.730.290.160.080.040.01
Нареч.6.9917.962.946.084.223.865.381.593.340.750.510.080.020.00
Местоим-прилаг.18.055.222.001.661.143.821.650.811.610.300.200.080.010.00
Частица4.8615.751.803.191.401.282.211.131.690.470.110.030.010.00
Местоим. нареч.0.842.691.390.752.200.401.060.281.090.210.030.040.010.00
Числит.5.680.450.090.260.150.470.110.090.040.030.310.030.010.00
Числит-прилаг.2.230.200.050.150.130.190.060.030.060.010.030.020.000.00
Междомет.0.410.080.030.030.070.030.010.060.020.000.010.000.040.00
Часть комп.
сложн. слова
0.040.000.000.000.000.110.010.000.000.000.000.000.000.00

Части речи на позициях в предложении

Таблица показывает, с какой частотой употреблены автором различные части на позициях в предложении. Например, ячейка «глагол – 3» показывает с какой вероятностью третье слово в случайно взятом предложении произведения является глаголом. Вероятность выражена в процентах. В каждом столбце максимальное значение отмечено розовым цветом, что позволяет по первым трём-пяти столбцам примерно представить типичное для произведения начало предлоджения. Например, последовательность «местоимение-существительное, глагол, прилагательное, существительное» может быть чем-то вроде «Он срубил старое дерево...»

Номер слова в предложении
12345
Сущ.27.4431.7730.1931.5332.19
Глаг.15.5021.1120.6019.2917.48
Мест.-сущ.8.997.786.185.895.62
Предл.17.5710.7812.7412.7012.65
Союз7.184.496.267.128.33
Прилаг.4.606.858.058.579.19
Нареч.8.176.676.415.074.83
Местоим-прилаг.3.924.063.503.743.64
Частица3.674.123.913.863.68
Местоим. нареч.1.970.940.870.810.91
Числит.0.420.850.911.081.13
Числит-прилаг.0.340.520.330.290.31
Междомет.0.210.050.040.040.02
Часть комп.
сложн. слова
0.020.010.000.010.01

Номер слова в предложении
678910
Сущ.32.1832.1632.2132.1232.21
Глаг.16.4316.0015.5415.8215.21
Мест.-сущ.5.145.625.185.275.45
Предл.13.5714.0514.1913.1713.50
Союз9.088.948.899.459.21
Прилаг.9.179.219.309.949.63
Нареч.4.784.634.214.664.48
Местоим-прилаг.3.653.654.113.923.95
Частица3.523.393.943.523.93
Местоим. нареч.1.121.041.190.911.30
Числит.1.091.050.940.920.80
Числит-прилаг.0.250.230.270.240.32
Междомет.0.010.020.010.030.02
Часть комп.
сложн. слова
0.010.010.020.030.00

Номер слова в предложении
1112131415
Сущ.32.2332.8532.5732.8332.05
Глаг.15.5015.4615.8014.7614.96
Мест.-сущ.5.575.194.844.614.55
Предл.14.0313.5513.5313.8414.22
Союз8.648.479.169.379.61
Прилаг.9.4510.3310.229.8910.18
Нареч.4.294.524.054.413.44
Местоим-прилаг.4.203.973.533.404.42
Частица3.763.393.754.014.21
Местоим. нареч.0.921.051.231.411.21
Числит.0.880.920.911.010.67
Числит-прилаг.0.460.210.350.400.40
Междомет.0.060.020.050.030.07
Часть комп.
сложн. слова
0.000.060.000.030.00