Лингвистический анализ: Евреи в НКВД СССР. 1936–1938 гг. Опыт биографического словаря. (Михаил Тумшис)


- Евреи в НКВД СССР. 1936–1938 гг. Опыт биографического словаря. 9.61 Мб, 1120с. скачать: (fb2) (исправленную)  читать: (полностью)  - Михаил Атанасович Тумшис - Вадим Анатольевич Золотарёв

Общая статистика

Длина текста2014632 знаков
Длина диалогов2008 знаков
Слов в произведении (СВП)271124 слов
Приблизительно страниц1120 стр.
Средняя длина слова5.46 знаков
Предложений в произведении (ПВП)40907 предл.
Средняя длина предложения (СДП)46.25 знаков
Доля диалогов в тексте0.10 %
Доля авторского текста99.9 %
СДП диалогов59.88 знаков
СДП авторского текста40.12 знаков
Использование диалогов по тексту книги № 383251: Евреи в НКВД СССР. 1936–1938 гг. Опыт биографического словаря. (Михаил Тумшис)
Максимальный фрагмент авторского текста - 0 знаков (в страницах - примерно 0, начинается где-то с 1 страницы)

Активный словарный запас

Использовано уникальных слов26156
Активный словарный запас (АСЗ)22083
Активный не словарный запас (АНСЗ)4073
Удельный АСЗ на 3000 слов текста1041.69110345 место в рейтинге УАСЗ-3000
Удельный АСЗ на 10000 слов текста2562.2967500 место в рейтинге УАСЗ-10000
Удельный АСЗ на 100000 слов текста13104.53458 место в рейтинге УАСЗ-100000
Удельный АСЗ-3000 книги № 383251: Евреи в НКВД СССР. 1936–1938 гг. Опыт биографического словаря. (Михаил Тумшис)
Максимальный УАСЗ-3000 (1605) наблюдается примерно на 879 странице
Минимальный УАСЗ-3000 (632) наблюдается примерно на 322 странице
Рост АСЗ книги № 383251: Евреи в НКВД СССР. 1936–1938 гг. Опыт биографического словаря. (Михаил Тумшис)

Буквы и знаки препинания

Всего букв1475236 букв
Всего знаков препинания86059 знаков

ЗнакКол-во (шт.)Средн. кол-во на 1000 слов (шт.)
, 1717463.34
. 50448186.07
- 579121.36
? 3101.14
! 180.07
... 00.00
!.. 10.00
?.. 00.00
!!! 00.00
?! 00.00
" 1890.70
() 922234.01
: 22468.28
; 6602.43
БукваКол-во (шт.)Частота использования (в %)
А1223268.29
Б289801.96
В748955.08
Г567803.85
Д435782.95
Е-Ё1096127.43
Ж567803.85
З213751.45
И-Й1228668.33
К697944.73
Л648084.39
М393702.67
Н1101067.46
О15183710.29
П418912.84
Р824295.59
С932986.32
Т695534.71
У375232.54
Ф45020.31
Х96290.65
Ц67090.45
Ч227041.54
Ш70040.47
Щ40980.28
Ь-Ъ212591.44
Ы158601.08
Э22710.15
Ю70910.48
Я256541.74
Диаграма использования букв книги № 383251: Евреи в НКВД СССР. 1936–1938 гг. Опыт биографического словаря. (Михаил Тумшис)

Части речи

Определенных частей речи (ОЧР)262524 слов
Не определенных частей речи (НОЧР)8600 слов

Часть речиКол-во (шт.)% в тексте (ОЧР - 100%)
Сущ.15227458.004
Глаг.37676.300
Мест.-сущ.37671.435
Предл.2880715.345
Союз102184
Прилаг.2880710.973
Нареч.50591.927
Местоим-прилаг.24100.918
Частица19100.728
Местоим. нареч.4390.167
Числит.1770.067
Числит-прилаг.1100.042
Междомет.970.037
Часть комп.
сложн. слова
4330.165

Биграммы частей речи

В таблице показаны частоты словопар типа «сглагол+уществительное», «предлог+прилагательное» и т.д. Частота выражена в среднем количестве пары на 1000 слов текста. Вертикаль отражает часть речи первого слова биграммы, горизонталь — второго.

Сущ.Глаг.Мест.-сущ.Предл.СоюзПрилаг.Нареч.Местоим-прилаг.ЧастицаМестоим. нареч.Числит.Числит-прилаг.Междомет.Часть комп.
сложн. слова
Сущ.329.5735.024.73107.9926.2254.1712.962.973.421.060.200.160.301.26
Глаг.15.487.042.0823.164.216.391.891.331.030.190.140.040.000.02
Мест.-сущ.4.373.640.471.381.601.220.630.200.700.100.020.020.000.00
Предл.110.263.303.884.541.6924.860.733.250.300.040.160.150.030.26
Союз19.103.751.814.721.364.841.570.830.670.160.050.020.010.04
Прилаг.85.741.820.514.922.3413.330.650.100.190.040.020.010.010.07
Нареч.6.704.020.244.760.542.080.430.180.270.030.020.000.000.00
Местоим-прилаг.5.141.090.330.660.201.150.150.130.300.020.010.010.000.00
Частица1.992.790.131.000.290.420.200.150.240.040.020.000.000.00
Местоим. нареч.0.130.490.110.260.370.070.070.030.130.010.000.000.000.00
Числит.0.450.030.030.020.010.100.000.010.000.000.030.000.000.00
Числит-прилаг.0.340.000.000.020.000.040.000.000.020.000.000.000.000.00
Междомет.0.310.000.010.010.030.010.000.000.000.000.000.000.000.00
Часть комп.
сложн. слова
0.470.000.010.020.071.070.000.000.000.000.000.000.000.01

Части речи на позициях в предложении

Таблица показывает, с какой частотой употреблены автором различные части на позициях в предложении. Например, ячейка «глагол – 3» показывает с какой вероятностью третье слово в случайно взятом предложении произведения является глаголом. Вероятность выражена в процентах. В каждом столбце максимальное значение отмечено розовым цветом, что позволяет по первым трём-пяти столбцам примерно представить типичное для произведения начало предлоджения. Например, последовательность «местоимение-существительное, глагол, прилагательное, существительное» может быть чем-то вроде «Он срубил старое дерево...»

Номер слова в предложении
12345
Сущ.48.9662.9563.6261.6757.43
Глаг.11.864.985.355.364.88
Мест.-сущ.0.971.061.101.131.28
Предл.28.3212.4313.2214.7115.63
Союз1.703.122.742.923.89
Прилаг.5.5812.1711.4911.5512.48
Нареч.1.281.780.981.222.46
Местоим-прилаг.0.460.730.730.620.81
Частица0.410.430.370.520.61
Местоим. нареч.0.270.100.080.040.13
Числит.0.020.050.060.040.10
Числит-прилаг.0.030.030.070.030.04
Междомет.0.020.000.000.000.01
Часть комп.
сложн. слова
0.110.160.180.170.25

Номер слова в предложении
678910
Сущ.52.2353.4654.8856.0855.71
Глаг.5.535.185.195.525.73
Мест.-сущ.1.231.181.331.411.69
Предл.16.9417.0215.9014.1014.07
Союз3.943.523.673.654.28
Прилаг.14.3013.9113.1213.3513.56
Нареч.3.543.423.603.192.71
Местоим-прилаг.0.880.971.031.121.02
Частица0.860.890.780.960.86
Местоим. нареч.0.150.160.140.200.13
Числит.0.100.090.080.150.05
Числит-прилаг.0.060.050.080.030.03
Междомет.0.000.000.000.000.00
Часть комп.
сложн. слова
0.240.150.200.250.18

Номер слова в предложении
1112131415
Сущ.56.2954.8754.5453.4452.57
Глаг.5.785.995.435.346.73
Мест.-сущ.1.711.831.711.981.94
Предл.14.1314.3114.7014.3014.19
Союз4.064.794.735.145.12
Прилаг.12.7913.2313.6814.8814.14
Нареч.2.532.472.422.222.22
Местоим-прилаг.1.241.001.271.331.43
Частица0.801.050.920.801.12
Местоим. нареч.0.320.200.210.310.28
Числит.0.120.070.130.020.13
Числит-прилаг.0.030.000.020.070.03
Междомет.0.000.000.000.000.00
Часть комп.
сложн. слова
0.200.190.210.180.10