Лингвистический анализ: Идишская цивилизация: становление и упадок забытой нации (Пол Кривачек)


- Идишская цивилизация: становление и упадок забытой нации (пер. Виктор Рыжик) 3.25 Мб, 425с. скачать: (fb2) (исправленную)  читать: (полностью)  - Пол Кривачек

Общая статистика

Длина текста764993 знаков
Длина диалогов773 знаков
Слов в произведении (СВП)106110 слов
Приблизительно страниц425 стр.
Средняя длина слова5.89 знаков
Предложений в произведении (ПВП)5176 предл.
Средняя длина предложения (СДП)144.82 знаков
Доля диалогов в тексте0.10 %
Доля авторского текста99.9 %
СДП диалогов95.75 знаков
СДП авторского текста147.23 знаков
Использование диалогов по тексту книги № 287875: Идишская цивилизация: становление и упадок забытой нации (Пол Кривачек)
Максимальный фрагмент авторского текста - 664568 знаков (в страницах - примерно 369, начинается где-то с 1 страницы)

Активный словарный запас

Использовано уникальных слов28470
Активный словарный запас (АСЗ)25363
Активный не словарный запас (АНСЗ)3107
Удельный АСЗ на 3000 слов текста1739.12426873 место в рейтинге УАСЗ-3000
Удельный АСЗ на 10000 слов текста4729.74361500 место в рейтинге УАСЗ-10000
Удельный АСЗ на 100000 слов текста27348.826566 место в рейтинге УАСЗ-100000
Удельный АСЗ-3000 книги № 287875: Идишская цивилизация: становление и упадок забытой нации (Пол Кривачек)
Максимальный УАСЗ-3000 (1849) наблюдается примерно на 421 странице
Минимальный УАСЗ-3000 (1543) наблюдается примерно на 272 странице
Рост АСЗ книги № 287875: Идишская цивилизация: становление и упадок забытой нации (Пол Кривачек)

Буквы и знаки препинания

Всего букв606407 букв
Всего знаков препинания20197 знаков

ЗнакКол-во (шт.)Средн. кол-во на 1000 слов (шт.)
, 11878111.94
. 532450.17
- 8648.14
? 1020.96
! 400.38
... 00.00
!.. 00.00
?.. 00.00
!!! 10.01
?! 10.01
" 00.00
() 7657.21
: 6686.30
; 5545.22
БукваКол-во (шт.)Частота использования (в %)
А445927.35
Б101841.68
В300604.96
Г120051.98
Д179452.96
Е-Ё542858.95
Ж120051.98
З94651.56
И-Й6258710.32
К206673.41
Л266104.39
М202883.35
Н394026.50
О6401610.56
П155102.56
Р307825.08
С333325.50
Т323955.34
У126732.09
Ф14960.25
Х71481.18
Ц34470.57
Ч74371.23
Ш50380.83
Щ24560.41
Ь-Ъ91351.51
Ы121472.00
Э16220.27
Ю36180.60
Я109521.81
Диаграма использования букв книги № 287875: Идишская цивилизация: становление и упадок забытой нации (Пол Кривачек)

Части речи

Определенных частей речи (ОЧР)101885 слов
Не определенных частей речи (НОЧР)4225 слов

Часть речиКол-во (шт.)% в тексте (ОЧР - 100%)
Сущ.3655535.879
Глаг.503714.220
Мест.-сущ.50374.944
Предл.1229712.351
Союз81748
Прилаг.1229712.069
Нареч.40153.941
Местоим-прилаг.44364.354
Частица24432.398
Местоим. нареч.9680.950
Числит.5380.528
Числит-прилаг.2420.238
Междомет.530.052
Часть комп.
сложн. слова
550.054

Биграммы частей речи

В таблице показаны частоты словопар типа «сглагол+уществительное», «предлог+прилагательное» и т.д. Частота выражена в среднем количестве пары на 1000 слов текста. Вертикаль отражает часть речи первого слова биграммы, горизонталь — второго.

Сущ.Глаг.Мест.-сущ.Предл.СоюзПрилаг.Нареч.Местоим-прилаг.ЧастицаМестоим. нареч.Числит.Числит-прилаг.Междомет.Часть комп.
сложн. слова
Сущ.99.1460.0512.8862.2346.8833.9815.4713.876.635.071.160.880.440.12
Глаг.33.4115.139.3533.8910.0817.897.657.504.601.360.910.350.030.03
Мест.-сущ.11.9716.041.442.924.654.532.841.213.200.370.180.090.000.00
Предл.68.612.2311.040.560.5823.451.3013.190.040.091.650.530.010.25
Союз23.2513.577.317.392.9911.554.903.924.040.840.280.140.020.01
Прилаг.86.884.441.074.267.7413.271.070.680.480.430.200.090.000.09
Нареч.4.0413.421.845.422.995.502.561.161.460.470.490.050.000.00
Местоим-прилаг.20.985.102.553.191.376.301.360.851.280.210.160.150.020.01
Частица3.859.651.142.680.582.151.410.891.210.300.070.050.000.00
Местоим. нареч.0.952.250.710.702.120.520.730.200.980.330.010.010.000.00
Числит.3.600.130.050.150.180.790.120.050.050.010.120.040.000.01
Числит-прилаг.1.450.110.040.130.040.510.010.020.010.000.060.000.000.00
Междомет.0.350.090.020.010.010.020.000.010.000.000.000.000.000.01
Часть комп.
сложн. слова
0.270.000.000.000.010.240.000.000.000.000.000.000.000.02

Части речи на позициях в предложении

Таблица показывает, с какой частотой употреблены автором различные части на позициях в предложении. Например, ячейка «глагол – 3» показывает с какой вероятностью третье слово в случайно взятом предложении произведения является глаголом. Вероятность выражена в процентах. В каждом столбце максимальное значение отмечено розовым цветом, что позволяет по первым трём-пяти столбцам примерно представить типичное для произведения начало предлоджения. Например, последовательность «местоимение-существительное, глагол, прилагательное, существительное» может быть чем-то вроде «Он срубил старое дерево...»

Номер слова в предложении
12345
Сущ.22.2835.8334.5234.6435.04
Глаг.5.5617.8818.9418.1217.17
Мест.-сущ.10.677.586.084.815.16
Предл.19.689.4210.5812.5211.38
Союз11.764.206.105.676.59
Прилаг.9.679.7310.4911.1412.49
Нареч.8.954.754.484.004.04
Местоим-прилаг.5.914.723.654.194.04
Частица2.303.573.373.072.42
Местоим. нареч.2.251.060.820.740.80
Числит.0.560.680.520.690.51
Числит-прилаг.0.370.450.350.330.24
Междомет.0.000.050.050.020.05
Часть комп.
сложн. слова
0.050.070.050.050.07

Номер слова в предложении
678910
Сущ.35.9436.2334.9735.5135.05
Глаг.16.4915.0214.9514.9014.63
Мест.-сущ.4.224.233.474.253.69
Предл.12.2511.6312.7113.1912.56
Союз7.077.268.617.458.34
Прилаг.13.0212.3012.6313.3513.09
Нареч.3.603.973.633.604.28
Местоим-прилаг.3.755.024.283.984.50
Частица2.182.322.872.092.32
Местоим. нареч.0.891.170.780.700.67
Числит.0.370.610.630.680.56
Числит-прилаг.0.200.250.260.190.17
Междомет.0.020.000.100.050.08
Часть комп.
сложн. слова
0.000.000.100.050.06

Номер слова в предложении
1112131415
Сущ.34.2735.4835.7135.3935.62
Глаг.14.3814.8213.6813.2514.05
Мест.-сущ.4.584.644.635.364.81
Предл.13.3412.8512.7012.2513.17
Союз7.808.218.639.199.41
Прилаг.12.6712.3912.9812.8212.05
Нареч.3.744.033.434.233.16
Местоим-прилаг.4.814.124.163.893.72
Частица2.611.942.322.332.25
Местоим. нареч.0.960.820.980.730.98
Числит.0.350.550.510.330.42
Числит-прилаг.0.290.060.250.170.21
Междомет.0.060.030.000.070.07
Часть комп.
сложн. слова
0.140.060.000.000.07