Лингвистический анализ: ИЗБРАННЫЕ ПРОИЗВЕДЕНИЯ В ОДНОМ ТОМЕ (Джордж Оруэлл)


- ИЗБРАННЫЕ ПРОИЗВЕДЕНИЯ В ОДНОМ ТОМЕ (а.с. Джордж Оруэлл. Сборники) 5.54 Мб, 1566с. скачать: (fb2) - (исправленную)  читать: (полностью) - (постранично) - Джордж Оруэлл

Общая статистика

Длина текста2817547 знаков
Длина диалогов462835 знаков
Слов в произведении (СВП)417686 слов
Приблизительно страниц1566 стр.
Средняя длина слова5.43 знаков
Предложений в произведении (ПВП)36577 предл.
Средняя длина предложения (СДП)74.22 знаков
Доля диалогов в тексте16.43 %
Доля авторского текста83.57 %
СДП диалогов71.66 знаков
СДП авторского текста100.24 знаков
Использование диалогов по тексту книги № 421515: ИЗБРАННЫЕ ПРОИЗВЕДЕНИЯ В ОДНОМ ТОМЕ (Джордж Оруэлл)
Максимальный фрагмент авторского текста - 73370 знаков (в страницах - примерно 41, начинается где-то с 595 страницы)

Активный словарный запас

Использовано уникальных слов73967
Активный словарный запас (АСЗ)71317
Активный не словарный запас (АНСЗ)2650
Удельный АСЗ на 3000 слов текста1715.32306292 место в рейтинге УАСЗ-3000
Удельный АСЗ на 10000 слов текста4681.02277902 место в рейтинге УАСЗ-10000
Удельный АСЗ на 100000 слов текста28089.7555838 место в рейтинге УАСЗ-100000
Удельный АСЗ-3000 книги № 421515: ИЗБРАННЫЕ ПРОИЗВЕДЕНИЯ В ОДНОМ ТОМЕ (Джордж Оруэлл)
Максимальный УАСЗ-3000 (2064) наблюдается примерно на 229 странице
Минимальный УАСЗ-3000 (1244) наблюдается примерно на 1413 странице
Рост АСЗ книги № 421515: ИЗБРАННЫЕ ПРОИЗВЕДЕНИЯ В ОДНОМ ТОМЕ (Джордж Оруэлл)

Буквы и знаки препинания

Всего букв2263407 букв
Всего знаков препинания99983 знаков

ЗнакКол-во (шт.)Средн. кол-во на 1000 слов (шт.)
, 53140127.22
. 3003471.91
- 493411.81
? 32437.76
! 40749.75
... 00.00
!.. 410.10
?.. 80.02
!!! 10.00
?! 80.02
" 00.00
() 13443.22
: 21785.21
; 9782.34
БукваКол-во (шт.)Частота использования (в %)
А1754797.75
Б399501.77
В989814.37
Г388121.71
Д724293.20
Е-Ё1848648.17
Ж388121.71
З380801.68
И-Й1861558.22
К781683.45
Л1104124.88
М707043.12
Н1517396.70
О24976411.03
П642372.84
Р1033084.56
С1208145.34
Т1369386.05
У634542.80
Ф50340.22
Х231931.02
Ц93120.41
Ч340391.50
Ш204800.90
Щ88030.39
Ь-Ъ466762.06
Ы443271.96
Э59670.26
Ю124250.55
Я453532.00
Диаграма использования букв книги № 421515: ИЗБРАННЫЕ ПРОИЗВЕДЕНИЯ В ОДНОМ ТОМЕ (Джордж Оруэлл)

Части речи

Определенных частей речи (ОЧР)416407 слов
Не определенных частей речи (НОЧР)1279 слов

Часть речиКол-во (шт.)% в тексте (ОЧР - 100%)
Сущ.11896428.569
Глаг.3217617.720
Мест.-сущ.321767.727
Предл.3647110.737
Союз324998
Прилаг.364718.758
Нареч.275396.613
Местоим-прилаг.166764.005
Частица208435.005
Местоим. нареч.67621.624
Числит.45711.098
Числит-прилаг.7400.178
Междомет.6210.149
Часть комп.
сложн. слова
480.012

Биграммы частей речи

В таблице показаны частоты словопар типа «сглагол+уществительное», «предлог+прилагательное» и т.д. Частота выражена в среднем количестве пары на 1000 слов текста. Вертикаль отражает часть речи первого слова биграммы, горизонталь — второго.

Сущ.Глаг.Мест.-сущ.Предл.СоюзПрилаг.Нареч.Местоим-прилаг.ЧастицаМестоим. нареч.Числит.Числит-прилаг.Междомет.Часть комп.
сложн. слова
Сущ.63.0556.2317.2041.1834.8321.5619.9810.6012.494.912.500.500.610.05
Глаг.41.0020.6016.8033.9917.2314.0712.766.878.752.961.620.210.320.01
Мест.-сущ.10.4124.894.356.725.054.858.212.208.031.950.470.070.080.00
Предл.58.662.2913.481.101.0316.070.969.860.310.082.850.600.060.03
Союз15.3014.7310.497.043.355.597.923.746.512.550.660.120.050.00
Прилаг.58.184.691.853.234.769.981.811.081.200.410.300.020.070.00
Нареч.6.0323.844.225.955.276.126.181.774.781.050.780.060.090.00
Местоим-прилаг.17.584.233.472.061.454.841.921.322.070.630.370.080.020.00
Частица6.1121.053.134.212.202.704.101.793.061.160.450.040.040.00
Местоим. нареч.1.433.631.851.132.020.891.730.472.510.470.080.010.020.00
Числит.6.320.750.270.580.590.720.400.230.150.050.850.050.000.00
Числит-прилаг.1.130.110.060.090.100.100.060.040.050.010.020.010.000.00
Междомет.0.440.160.080.080.150.090.100.080.150.020.010.000.120.00
Часть комп.
сложн. слова
0.040.010.000.010.020.030.000.000.000.000.000.000.000.00

Части речи на позициях в предложении

Таблица показывает, с какой частотой употреблены автором различные части на позициях в предложении. Например, ячейка «глагол – 3» показывает с какой вероятностью третье слово в случайно взятом предложении произведения является глаголом. Вероятность выражена в процентах. В каждом столбце максимальное значение отмечено розовым цветом, что позволяет по первым трём-пяти столбцам примерно представить типичное для произведения начало предлоджения. Например, последовательность «местоимение-существительное, глагол, прилагательное, существительное» может быть чем-то вроде «Он срубил старое дерево...»

Номер слова в предложении
12345
Сущ.20.4122.9725.1126.4526.92
Глаг.13.3820.5820.4820.2419.24
Мест.-сущ.11.6911.209.368.777.81
Предл.11.788.4110.5110.9911.39
Союз13.635.446.016.306.97
Прилаг.5.546.717.528.368.89
Нареч.8.938.267.716.716.50
Местоим-прилаг.3.905.194.074.244.22
Частица6.147.496.225.055.18
Местоим. нареч.2.572.201.591.521.57
Числит.0.880.991.141.141.05
Числит-прилаг.0.210.360.170.160.17
Междомет.0.930.210.090.060.07
Часть комп.
сложн. слова
0.010.010.010.010.02

Номер слова в предложении
678910
Сущ.27.4827.6427.7128.1127.94
Глаг.18.6817.6716.9716.8716.80
Мест.-сущ.7.167.047.086.726.82
Предл.11.5511.7511.5511.7611.51
Союз7.458.228.308.328.58
Прилаг.9.349.479.8810.3010.43
Нареч.6.226.196.355.966.11
Местоим-прилаг.4.144.384.164.083.85
Частица5.094.875.035.045.11
Местоим. нареч.1.511.421.511.411.52
Числит.1.121.111.251.231.14
Числит-прилаг.0.180.160.150.120.10
Междомет.0.080.050.060.070.06
Часть комп.
сложн. слова
0.010.020.010.030.03

Номер слова в предложении
1112131415
Сущ.27.5627.8928.4527.8328.28
Глаг.16.3716.2416.0216.1815.69
Мест.-сущ.6.686.156.406.446.24
Предл.12.3512.3611.9212.1812.07
Союз8.328.288.298.878.40
Прилаг.10.4611.1611.0910.7711.31
Нареч.6.165.855.915.945.73
Местоим-прилаг.4.144.024.183.924.02
Частица5.124.844.925.345.45
Местоим. нареч.1.501.631.471.161.35
Числит.1.111.301.221.151.19
Числит-прилаг.0.150.170.100.130.19
Междомет.0.040.100.040.050.04
Часть комп.
сложн. слова
0.030.020.000.030.04