Лингвистический анализ: Очерки по русской семантике (Александр Пеньковский)


- Очерки по русской семантике 2.27 Мб, 528с. скачать: (fb2) (исправленную)  читать: (полностью)  - Александр Борисович Пеньковский

Общая статистика

Длина текста950178 знаков
Длина диалогов3829 знаков
Слов в произведении (СВП)128441 слов
Приблизительно страниц528 стр.
Средняя длина слова5.74 знаков
Предложений в произведении (ПВП)12785 предл.
Средняя длина предложения (СДП)71.36 знаков
Доля диалогов в тексте0.40 %
Доля авторского текста99.6 %
СДП диалогов59.79 знаков
СДП авторского текста72.24 знаков
Использование диалогов по тексту книги № 285733: Очерки по русской семантике (Александр Пеньковский)
Максимальный фрагмент авторского текста - 359131 знаков (в страницах - примерно 200, начинается где-то с 114 страницы)

Активный словарный запас

Использовано уникальных слов29239
Активный словарный запас (АСЗ)26346
Активный не словарный запас (АНСЗ)2893
Удельный АСЗ на 3000 слов текста1541.85203587 место в рейтинге УАСЗ-3000
Удельный АСЗ на 10000 слов текста4179.13360451 место в рейтинге УАСЗ-10000
Удельный АСЗ на 100000 слов текста24562.2968265 место в рейтинге УАСЗ-100000
Удельный АСЗ-3000 книги № 285733: Очерки по русской семантике (Александр Пеньковский)
Максимальный УАСЗ-3000 (1748) наблюдается примерно на 304 странице
Минимальный УАСЗ-3000 (1330) наблюдается примерно на 21 странице
Рост АСЗ книги № 285733: Очерки по русской семантике (Александр Пеньковский)

Буквы и знаки препинания

Всего букв734054 букв
Всего знаков препинания40089 знаков

ЗнакКол-во (шт.)Средн. кол-во на 1000 слов (шт.)
, 14533113.15
. 14640113.98
- 235318.32
? 3973.09
! 4513.51
... 00.00
!.. 980.76
?.. 00.00
!!! 10.01
?! 90.07
" 30.02
() 342326.65
: 222617.33
; 195515.22
БукваКол-во (шт.)Частота использования (в %)
А539747.35
Б111651.52
В363224.95
Г120131.64
Д186432.54
Е-Ё647558.82
Ж120131.64
З119091.62
И-Й681329.28
К268043.65
Л273583.73
М229673.13
Н524337.14
О8008610.91
П189702.58
Р350884.78
С418135.70
Т451766.15
У179272.44
Ф26420.36
Х76331.04
Ц37100.51
Ч120621.64
Ш43410.59
Щ28780.39
Ь-Ъ123441.68
Ы136561.86
Э21990.30
Ю47390.65
Я155412.12
Диаграма использования букв книги № 285733: Очерки по русской семантике (Александр Пеньковский)

Части речи

Определенных частей речи (ОЧР)125615 слов
Не определенных частей речи (НОЧР)2826 слов

Часть речиКол-во (шт.)% в тексте (ОЧР - 100%)
Сущ.4491935.759
Глаг.710311.846
Мест.-сущ.71035.655
Предл.1435710.848
Союз113799
Прилаг.1435711.429
Нареч.66925.327
Местоим-прилаг.53404.251
Частица46483.700
Местоим. нареч.16621.323
Числит.4810.383
Числит-прилаг.3970.316
Междомет.1080.086
Часть комп.
сложн. слова
220.018

Биграммы частей речи

В таблице показаны частоты словопар типа «сглагол+уществительное», «предлог+прилагательное» и т.д. Частота выражена в среднем количестве пары на 1000 слов текста. Вертикаль отражает часть речи первого слова биграммы, горизонталь — второго.

Сущ.Глаг.Мест.-сущ.Предл.СоюзПрилаг.Нареч.Местоим-прилаг.ЧастицаМестоим. нареч.Числит.Числит-прилаг.Междомет.Часть комп.
сложн. слова
Сущ.127.2437.8214.4449.7943.2936.8316.5013.8210.284.911.170.970.450.08
Глаг.25.8214.9311.3321.6312.6210.648.265.135.271.800.540.370.120.01
Мест.-сущ.13.6111.532.525.125.445.064.662.095.101.030.180.100.060.03
Предл.54.442.9512.042.582.3218.062.1211.100.590.260.721.210.070.02
Союз27.0612.366.459.625.6110.387.183.776.051.600.280.170.050.02
Прилаг.72.714.512.045.178.6315.242.771.091.220.580.170.110.030.02
Нареч.5.4514.741.916.086.117.875.991.192.850.860.110.100.020.00
Местоим-прилаг.18.774.472.772.551.865.451.791.651.831.030.290.050.020.00
Частица6.1012.631.994.271.732.932.442.091.930.690.170.020.010.00
Местоим. нареч.1.911.920.801.252.520.921.330.391.710.400.050.020.020.00
Числит.2.050.220.100.150.160.600.150.140.060.020.150.020.000.00
Числит-прилаг.2.090.200.100.180.140.240.050.040.090.020.010.020.000.00
Междомет.0.290.140.070.090.120.030.030.020.020.020.000.000.020.00
Часть комп.
сложн. слова
0.030.050.000.000.030.060.000.000.000.000.000.000.000.00

Части речи на позициях в предложении

Таблица показывает, с какой частотой употреблены автором различные части на позициях в предложении. Например, ячейка «глагол – 3» показывает с какой вероятностью третье слово в случайно взятом предложении произведения является глаголом. Вероятность выражена в процентах. В каждом столбце максимальное значение отмечено розовым цветом, что позволяет по первым трём-пяти столбцам примерно представить типичное для произведения начало предлоджения. Например, последовательность «местоимение-существительное, глагол, прилагательное, существительное» может быть чем-то вроде «Он срубил старое дерево...»

Номер слова в предложении
12345
Сущ.39.5735.7735.0736.0934.79
Глаг.5.4310.3412.2712.6213.91
Мест.-сущ.5.356.636.605.935.70
Предл.16.4910.0210.3010.6611.35
Союз5.847.497.777.727.70
Прилаг.10.0010.9611.1811.1411.55
Нареч.7.105.795.485.865.12
Местоим-прилаг.3.545.304.634.634.38
Частица2.735.204.323.543.27
Местоим. нареч.2.971.481.341.001.33
Числит.0.480.460.550.460.35
Числит-прилаг.0.320.390.440.310.42
Междомет.0.170.150.050.030.09
Часть комп.
сложн. слова
0.010.010.000.000.04

Номер слова в предложении
678910
Сущ.33.6634.6333.8934.1331.97
Глаг.13.3613.4913.2813.6613.16
Мест.-сущ.5.736.105.626.086.16
Предл.11.4310.4611.7610.3811.33
Союз7.598.048.378.359.36
Прилаг.12.5511.7711.2011.6811.89
Нареч.6.125.345.924.725.85
Местоим-прилаг.4.174.094.584.624.61
Частица3.153.583.654.053.83
Местоим. нареч.0.971.800.951.461.00
Числит.0.680.450.300.490.46
Числит-прилаг.0.440.180.390.320.24
Междомет.0.120.040.090.050.12
Часть комп.
сложн. слова
0.060.020.000.020.02

Номер слова в предложении
1112131415
Сущ.33.6133.7332.2831.4232.24
Глаг.13.9512.7213.9413.6812.21
Мест.-сущ.5.585.695.476.176.60
Предл.10.6710.4210.4811.5310.30
Союз7.629.359.6010.359.77
Прилаг.13.3612.6112.3711.9413.04
Нареч.4.805.095.475.175.58
Местоим-прилаг.4.654.434.603.904.75
Частица3.773.753.873.743.20
Местоим. нареч.1.341.311.311.151.29
Числит.0.230.410.410.410.36
Числит-прилаг.0.310.380.200.470.43
Междомет.0.100.080.000.030.17
Часть комп.
сложн. слова
0.000.030.000.030.07