Лингвистический анализ: Трилогия Крысы (Харуки Мураками)


- Трилогия Крысы (пер. Вадим Смоленский, ...) (и.с. Моя большая книга) 3.43 Мб, 996с. скачать: (fb2) (исправленную)  читать: (полностью)  - Харуки Мураками

Общая статистика

Длина текста1791823 знаков
Длина диалогов681168 знаков
Слов в произведении (СВП)281941 слов
Приблизительно страниц996 стр.
Средняя длина слова4.99 знаков
Предложений в произведении (ПВП)31819 предл.
Средняя длина предложения (СДП)53.45 знаков
Доля диалогов в тексте38.02 %
Доля авторского текста61.98 %
СДП диалогов56.19 знаков
СДП авторского текста69.80 знаков
Использование диалогов по тексту книги № 589372: Трилогия Крысы (Харуки Мураками)
Максимальный фрагмент авторского текста - 36831 знаков (в страницах - примерно 20, начинается где-то с 532 страницы)

Активный словарный запас

Использовано уникальных слов40727
Активный словарный запас (АСЗ)39342
Активный не словарный запас (АНСЗ)1385
Удельный АСЗ на 3000 слов текста1467.32247543 место в рейтинге УАСЗ-3000
Удельный АСЗ на 10000 слов текста3818.87227095 место в рейтинге УАСЗ-10000
Удельный АСЗ на 100000 слов текста20671.1035050 место в рейтинге УАСЗ-100000
Удельный АСЗ-3000 книги № 589372: Трилогия Крысы (Харуки Мураками)
Максимальный УАСЗ-3000 (1913) наблюдается примерно на 985 странице
Минимальный УАСЗ-3000 (1127) наблюдается примерно на 576 странице
Рост АСЗ книги № 589372: Трилогия Крысы (Харуки Мураками)

Буквы и знаки препинания

Всего букв1403318 букв
Всего знаков препинания65007 знаков

ЗнакКол-во (шт.)Средн. кол-во на 1000 слов (шт.)
, 2682295.13
. 2738097.11
- 456916.21
? 315811.20
! 13704.86
... 00.00
!.. 1370.49
?.. 560.20
!!! 110.04
?! 580.21
" 00.00
() 1770.63
: 9283.29
; 3411.21
БукваКол-во (шт.)Частота использования (в %)
А1178248.40
Б230031.64
В600224.28
Г231361.65
Д428573.05
Е-Ё1170908.34
Ж231361.65
З256331.83
И-Й1057157.53
К520333.71
Л690984.92
М445003.17
Н912256.50
О15530911.07
П396872.83
Р581734.15
С764015.44
Т859566.13
У406542.90
Ф28890.21
Х114200.81
Ц54410.39
Ч225811.61
Ш119830.85
Щ44120.31
Ь-Ъ291382.08
Ы249361.78
Э50200.36
Ю90040.64
Я340032.42
Диаграма использования букв книги № 589372: Трилогия Крысы (Харуки Мураками)

Части речи

Определенных частей речи (ОЧР)281367 слов
Не определенных частей речи (НОЧР)574 слов

Часть речиКол-во (шт.)% в тексте (ОЧР - 100%)
Сущ.6563723.328
Глаг.3073518.434
Мест.-сущ.3073510.923
Предл.1687710.744
Союз249479
Прилаг.168775.998
Нареч.202187.186
Местоим-прилаг.137144.874
Частица172456.129
Местоим. нареч.63622.261
Числит.25550.908
Числит-прилаг.6830.243
Междомет.2700.096
Часть комп.
сложн. слова
260.009

Биграммы частей речи

В таблице показаны частоты словопар типа «сглагол+уществительное», «предлог+прилагательное» и т.д. Частота выражена в среднем количестве пары на 1000 слов текста. Вертикаль отражает часть речи первого слова биграммы, горизонталь — второго.

Сущ.Глаг.Мест.-сущ.Предл.СоюзПрилаг.Нареч.Местоим-прилаг.ЧастицаМестоим. нареч.Числит.Числит-прилаг.Междомет.Часть комп.
сложн. слова
Сущ.41.3946.1919.8235.6632.8512.7115.449.4612.444.601.920.470.330.02
Глаг.32.9119.7326.5635.1919.739.5614.139.3410.544.911.250.270.210.02
Мест.-сущ.10.7833.938.359.388.994.6012.414.2812.383.240.630.130.140.00
Предл.55.611.3118.100.621.7812.300.8413.110.200.082.411.030.010.02
Союз10.5921.1414.138.174.493.849.064.647.874.070.530.100.030.01
Прилаг.41.433.061.722.104.014.151.220.661.070.320.180.040.020.01
Нареч.5.1222.106.866.336.665.248.412.356.361.700.610.060.050.00
Местоим-прилаг.21.294.684.982.672.234.062.701.553.070.970.430.100.020.00
Частица6.0026.244.855.103.972.234.642.403.661.860.250.040.050.00
Местоим. нареч.1.394.903.261.693.170.652.590.713.380.800.070.010.010.00
Числит.5.010.650.400.390.490.530.310.150.160.040.770.170.020.00
Числит-прилаг.1.520.200.110.120.140.080.060.050.100.010.030.020.000.00
Междомет.0.190.210.100.020.160.020.050.040.060.020.000.000.070.00
Часть комп.
сложн. слова
0.040.000.000.000.000.040.000.000.000.000.000.000.000.00

Части речи на позициях в предложении

Таблица показывает, с какой частотой употреблены автором различные части на позициях в предложении. Например, ячейка «глагол – 3» показывает с какой вероятностью третье слово в случайно взятом предложении произведения является глаголом. Вероятность выражена в процентах. В каждом столбце максимальное значение отмечено розовым цветом, что позволяет по первым трём-пяти столбцам примерно представить типичное для произведения начало предлоджения. Например, последовательность «местоимение-существительное, глагол, прилагательное, существительное» может быть чем-то вроде «Он срубил старое дерево...»

Номер слова в предложении
12345
Сущ.12.0017.5720.7321.6522.16
Глаг.12.6819.8519.8419.7419.85
Мест.-сущ.14.7513.5812.6212.1710.68
Предл.10.319.0110.8110.8711.60
Союз18.877.386.587.877.98
Прилаг.4.165.385.245.626.03
Нареч.8.898.608.157.246.83
Местоим-прилаг.4.545.614.895.085.21
Частица8.508.807.346.526.70
Местоим. нареч.3.822.832.482.051.77
Числит.0.810.970.950.940.92
Числит-прилаг.0.200.360.350.210.22
Междомет.0.490.060.030.030.04
Часть комп.
сложн. слова
0.000.010.000.010.01

Номер слова в предложении
678910
Сущ.22.0722.6423.4723.6323.61
Глаг.19.1618.3117.6817.0517.73
Мест.-сущ.10.509.649.128.938.41
Предл.11.8712.1812.1913.0413.34
Союз8.439.128.968.818.97
Прилаг.6.536.937.507.907.62
Нареч.6.456.396.386.226.22
Местоим-прилаг.5.175.425.325.075.36
Частица6.566.246.246.195.70
Местоим. нареч.2.111.921.841.941.78
Числит.0.920.881.000.861.07
Числит-прилаг.0.200.240.250.290.17
Междомет.0.040.060.030.040.02
Часть комп.
сложн. слова
0.000.020.020.010.01

Номер слова в предложении
1112131415
Сущ.24.3723.8324.4624.8824.30
Глаг.16.9517.0416.6716.6716.67
Мест.-сущ.8.148.528.068.217.87
Предл.13.1613.0313.4313.7513.73
Союз8.498.668.388.148.71
Прилаг.8.158.158.198.239.65
Нареч.6.176.036.315.935.41
Местоим-прилаг.5.165.365.154.984.71
Частица6.076.276.116.175.92
Местоим. нареч.2.062.101.991.711.63
Числит.1.080.810.990.961.12
Числит-прилаг.0.150.170.170.320.22
Междомет.0.040.040.070.050.04
Часть комп.
сложн. слова
0.010.000.010.000.02