Лингвистический анализ: Сочинения (Уильям Теккерей)


- Сочинения 8.75 Мб, 2654с. скачать: (fb2) (исправленную)  читать: (полностью)  - Уильям Мейкпис Теккерей

Общая статистика

Длина текста4775902 знаков
Длина диалогов1278495 знаков
Слов в произведении (СВП)733175 слов
Приблизительно страниц2654 стр.
Средняя длина слова5.24 знаков
Предложений в произведении (ПВП)38069 предл.
Средняя длина предложения (СДП)122.66 знаков
Доля диалогов в тексте26.77 %
Доля авторского текста73.23 %
СДП диалогов111.22 знаков
СДП авторского текста154.64 знаков
Использование диалогов по тексту книги № 257065: Сочинения (Уильям Теккерей)
Максимальный фрагмент авторского текста - 65808 знаков (в страницах - примерно 37, начинается где-то с 1356 страницы)

Активный словарный запас

Использовано уникальных слов79565
Активный словарный запас (АСЗ)74523
Активный не словарный запас (АНСЗ)5042
Удельный АСЗ на 3000 слов текста1555.9395005 место в рейтинге УАСЗ-3000
Удельный АСЗ на 10000 слов текста4134.2375632 место в рейтинге УАСЗ-10000
Удельный АСЗ на 100000 слов текста23021.6478977 место в рейтинге УАСЗ-100000
Удельный АСЗ-3000 книги № 257065: Сочинения (Уильям Теккерей)
Максимальный УАСЗ-3000 (1851) наблюдается примерно на 1346 странице
Минимальный УАСЗ-3000 (1272) наблюдается примерно на 2095 странице
Рост АСЗ книги № 257065: Сочинения (Уильям Теккерей)

Буквы и знаки препинания

Всего букв3827871 букв
Всего знаков препинания149251 знаков

ЗнакКол-во (шт.)Средн. кол-во на 1000 слов (шт.)
, 91822125.24
. 3356545.78
- 58207.94
? 42645.82
! 63768.70
... 430.06
!.. 1080.15
?.. 420.06
!!! 20.00
?! 550.08
" 10.00
() 23013.14
: 21032.87
; 27493.75
БукваКол-во (шт.)Частота использования (в %)
А3058107.99
Б715191.87
В1655784.33
Г745561.95
Д1260983.29
Е-Ё3259778.52
Ж745561.95
З588701.54
И-Й3219768.41
К1324713.46
Л1823864.76
М1351673.53
Н2443416.38
О41853610.93
П1011112.64
Р1753744.58
С2124905.55
Т2224655.81
У1035342.70
Ф66930.17
Х327350.86
Ц143010.37
Ч528861.38
Ш320580.84
Щ120740.32
Ь-Ъ720161.88
Ы707841.85
Э145840.38
Ю233000.61
Я750871.96
Диаграма использования букв книги № 257065: Сочинения (Уильям Теккерей)

Части речи

Определенных частей речи (ОЧР)730480 слов
Не определенных частей речи (НОЧР)2695 слов

Часть речиКол-во (шт.)% в тексте (ОЧР - 100%)
Сущ.20536828.114
Глаг.7448716.796
Мест.-сущ.7448710.197
Предл.5597310.572
Союз689279
Прилаг.559737.662
Нареч.331464.538
Местоим-прилаг.436035.969
Частица317694.349
Местоим. нареч.109681.501
Числит.42910.587
Числит-прилаг.10310.141
Междомет.9680.133
Часть комп.
сложн. слова
320.004

Биграммы частей речи

В таблице показаны частоты словопар типа «сглагол+уществительное», «предлог+прилагательное» и т.д. Частота выражена в среднем количестве пары на 1000 слов текста. Вертикаль отражает часть речи первого слова биграммы, горизонталь — второго.

Сущ.Глаг.Мест.-сущ.Предл.СоюзПрилаг.Нареч.Местоим-прилаг.ЧастицаМестоим. нареч.Числит.Числит-прилаг.Междомет.Часть комп.
сложн. слова
Сущ.62.9951.2420.3537.2949.6314.6411.7216.1010.134.801.270.340.620.02
Глаг.34.7217.8223.4836.2515.1610.668.1210.437.512.520.890.180.200.01
Мест.-сущ.18.3631.194.989.027.827.218.203.778.462.300.480.090.070.00
Предл.50.681.4119.790.591.0313.140.6316.430.110.131.230.480.050.01
Союз17.8018.4016.798.244.626.546.415.666.782.460.510.080.070.00
Прилаг.53.284.131.872.735.935.380.711.360.700.290.130.020.070.01
Нареч.3.6016.323.584.414.034.583.371.403.170.570.300.020.030.00
Местоим-прилаг.28.995.424.412.511.6810.151.701.891.840.740.270.080.020.00
Частица4.8918.354.453.401.942.282.861.912.250.840.260.050.020.00
Местоим. нареч.1.183.101.850.962.051.281.490.442.290.310.050.010.010.00
Числит.3.490.320.220.180.260.560.120.120.070.020.440.070.000.00
Числит-прилаг.0.860.100.050.080.060.070.010.040.090.010.030.000.000.00
Междомет.0.270.150.140.050.150.120.030.130.080.030.000.000.170.00
Часть комп.
сложн. слова
0.030.000.000.000.000.020.000.000.000.000.000.000.000.00

Части речи на позициях в предложении

Таблица показывает, с какой частотой употреблены автором различные части на позициях в предложении. Например, ячейка «глагол – 3» показывает с какой вероятностью третье слово в случайно взятом предложении произведения является глаголом. Вероятность выражена в процентах. В каждом столбце максимальное значение отмечено розовым цветом, что позволяет по первым трём-пяти столбцам примерно представить типичное для произведения начало предлоджения. Например, последовательность «местоимение-существительное, глагол, прилагательное, существительное» может быть чем-то вроде «Он срубил старое дерево...»

Номер слова в предложении
12345
Сущ.18.8424.0224.9626.7028.07
Глаг.9.2620.5121.9620.8719.25
Мест.-сущ.18.3813.6311.8111.3610.11
Предл.9.916.668.779.9410.62
Союз18.925.786.507.107.86
Прилаг.3.895.466.327.267.49
Нареч.5.345.915.404.514.51
Местоим-прилаг.5.165.885.405.565.75
Частица5.738.956.574.584.07
Местоим. нареч.2.702.151.461.371.44
Числит.0.530.540.590.580.61
Числит-прилаг.0.130.260.120.110.14
Междомет.1.230.250.150.050.07
Часть комп.
сложн. слова
0.000.000.000.010.01

Номер слова в предложении
678910
Сущ.28.6928.5528.7428.9128.36
Глаг.18.2117.2916.8516.2916.45
Мест.-сущ.9.699.369.409.599.59
Предл.10.8911.1310.9010.7311.13
Союз8.479.179.6810.1210.03
Прилаг.7.867.808.057.847.82
Нареч.4.224.434.214.244.18
Местоим-прилаг.6.056.316.136.196.05
Частица3.923.783.843.954.09
Местоим. нареч.1.211.371.391.321.45
Числит.0.610.590.630.620.63
Числит-прилаг.0.130.170.120.130.13
Междомет.0.060.070.050.070.08
Часть комп.
сложн. слова
0.000.000.010.000.01

Номер слова в предложении
1112131415
Сущ.27.5727.3528.1227.0227.45
Глаг.16.8317.0716.2717.0916.49
Мест.-сущ.9.419.139.869.739.43
Предл.11.2911.3110.9311.1611.53
Союз9.929.9110.129.8910.18
Прилаг.8.018.308.088.227.59
Нареч.4.434.084.514.354.42
Местоим-прилаг.6.276.206.026.216.48
Частица4.134.213.794.144.17
Местоим. нареч.1.391.591.551.531.41
Числит.0.550.600.570.480.68
Числит-прилаг.0.130.170.140.150.11
Междомет.0.050.080.050.040.04
Часть комп.
сложн. слова
0.010.000.000.000.01