Лингвистический анализ: Гарри Поттер (сборник 7 книг) (ЛП) (Джоан Роулинг)


- Гарри Поттер (сборник 7 книг) (ЛП) (а.с. Гарри Поттер) 11.05 Мб, 3382с. скачать: (fb2) (исправленную)  читать: (полностью)  - Джоан Кэтлин Роулинг

Общая статистика

Длина текста6087428 знаков
Длина диалогов3061725 знаков
Слов в произведении (СВП)928114 слов
Приблизительно страниц3382 стр.
Средняя длина слова5.19 знаков
Предложений в произведении (ПВП)86334 предл.
Средняя длина предложения (СДП)67.74 знаков
Доля диалогов в тексте50.30 %
Доля авторского текста49.7 %
СДП диалогов82.90 знаков
СДП авторского текста96.46 знаков
Использование диалогов по тексту книги № 318410: Гарри Поттер (сборник 7 книг) (ЛП) (Джоан Роулинг)
Максимальный фрагмент авторского текста - 16458 знаков (в страницах - примерно 9, начинается где-то с 3037 страницы)

Активный словарный запас

Использовано уникальных слов72585
Активный словарный запас (АСЗ)69242
Активный не словарный запас (АНСЗ)3343
Удельный АСЗ на 3000 слов текста1445.54418847 место в рейтинге УАСЗ-3000
Удельный АСЗ на 10000 слов текста3726.08393267 место в рейтинге УАСЗ-10000
Удельный АСЗ на 100000 слов текста19328.0069377 место в рейтинге УАСЗ-100000
Удельный АСЗ-3000 книги № 318410: Гарри Поттер (сборник 7 книг) (ЛП) (Джоан Роулинг)
Максимальный УАСЗ-3000 (1706) наблюдается примерно на 1064 странице
Минимальный УАСЗ-3000 (1180) наблюдается примерно на 1377 странице
Рост АСЗ книги № 318410: Гарри Поттер (сборник 7 книг) (ЛП) (Джоан Роулинг)

Буквы и знаки препинания

Всего букв4812740 букв
Всего знаков препинания277482 знаков

ЗнакКол-во (шт.)Средн. кол-во на 1000 слов (шт.)
, 112467121.18
. 6759572.83
- 7223877.83
? 1027311.07
! 940410.13
... 00.00
!.. 310.03
?.. 900.10
!!! 390.04
?! 1340.14
" 100.01
() 3000.32
: 38784.18
; 10231.10
БукваКол-во (шт.)Частота использования (в %)
А3974308.26
Б785611.63
В1975904.11
Г1139862.37
Д1505213.13
Е-Ё3759937.81
Ж1139862.37
З880411.83
И-Й3785247.87
К1589503.30
Л2594125.39
М1577573.28
Н3096586.43
О53122411.04
П1370962.85
Р2611525.43
С2550745.30
Т2752475.72
У1436792.99
Ф121940.25
Х400950.83
Ц129180.27
Ч699831.45
Ш415620.86
Щ154660.32
Ь-Ъ880951.83
Ы833791.73
Э143730.30
Ю245020.51
Я954951.98
Диаграма использования букв книги № 318410: Гарри Поттер (сборник 7 книг) (ЛП) (Джоан Роулинг)

Части речи

Определенных частей речи (ОЧР)927820 слов
Не определенных частей речи (НОЧР)294 слов

Часть речиКол-во (шт.)% в тексте (ОЧР - 100%)
Сущ.25522927.508
Глаг.9565220.480
Мест.-сущ.9565210.309
Предл.5220710.457
Союз776718
Прилаг.522075.627
Нареч.583986.294
Местоим-прилаг.340673.672
Частица440494.748
Местоим. нареч.151231.630
Числит.53950.581
Числит-прилаг.17110.184
Междомет.12680.137
Часть комп.
сложн. слова
130.001

Биграммы частей речи

В таблице показаны частоты словопар типа «сглагол+уществительное», «предлог+прилагательное» и т.д. Частота выражена в среднем количестве пары на 1000 слов текста. Вертикаль отражает часть речи первого слова биграммы, горизонталь — второго.

Сущ.Глаг.Мест.-сущ.Предл.СоюзПрилаг.Нареч.Местоим-прилаг.ЧастицаМестоим. нареч.Числит.Числит-прилаг.Междомет.Часть комп.
сложн. слова
Сущ.61.1064.4620.7933.3737.9110.9418.708.6512.424.471.350.420.510.00
Глаг.54.9422.8723.5341.3619.6111.0612.686.757.333.210.960.290.210.00
Мест.-сущ.13.5335.016.838.457.334.9210.103.0710.332.840.480.100.090.00
Предл.56.722.2618.870.771.2011.690.7710.050.140.051.290.720.030.01
Союз17.1118.2416.276.453.503.056.823.215.912.640.370.090.050.00
Прилаг.37.764.271.572.163.464.391.060.530.660.210.150.020.020.00
Нареч.5.7026.234.925.334.554.055.321.474.040.830.410.050.050.00
Местоим-прилаг.16.235.063.142.011.273.412.180.961.600.460.310.070.030.00
Частица5.5021.894.193.252.271.663.321.462.571.120.160.030.030.00
Местоим. нареч.1.443.552.571.092.150.581.720.412.280.420.060.010.020.00
Числит.3.460.550.200.220.240.450.190.090.080.020.260.050.010.00
Числит-прилаг.1.320.170.060.070.070.040.030.020.040.010.020.010.000.00
Междомет.0.270.220.130.040.160.050.060.030.080.020.000.000.310.00
Часть комп.
сложн. слова
0.010.000.000.000.000.000.000.000.000.000.000.000.000.00

Части речи на позициях в предложении

Таблица показывает, с какой частотой употреблены автором различные части на позициях в предложении. Например, ячейка «глагол – 3» показывает с какой вероятностью третье слово в случайно взятом предложении произведения является глаголом. Вероятность выражена в процентах. В каждом столбце максимальное значение отмечено розовым цветом, что позволяет по первым трём-пяти столбцам примерно представить типичное для произведения начало предлоджения. Например, последовательность «местоимение-существительное, глагол, прилагательное, существительное» может быть чем-то вроде «Он срубил старое дерево...»

Номер слова в предложении
12345
Сущ.23.8120.4722.8225.1926.01
Глаг.14.7026.7324.8223.4322.51
Мест.-сущ.16.6413.1211.3010.769.58
Предл.7.957.0510.4710.8211.59
Союз13.715.656.957.438.45
Прилаг.2.913.824.415.245.70
Нареч.7.758.607.186.225.83
Местоим-прилаг.2.853.723.423.673.80
Частица5.957.595.914.824.22
Местоим. нареч.2.492.281.761.521.44
Числит.0.460.580.650.620.60
Числит-прилаг.0.140.230.180.180.19
Междомет.0.640.170.140.080.10
Часть комп.
сложн. слова
0.000.000.000.000.00

Номер слова в предложении
678910
Сущ.27.0927.1327.6027.5127.44
Глаг.20.6920.1919.6019.3619.40
Мест.-сущ.9.189.209.059.029.10
Предл.11.9712.0512.1212.3212.01
Союз8.638.998.969.129.08
Прилаг.6.086.196.376.516.57
Нареч.5.695.725.645.815.51
Местоим-прилаг.3.823.953.933.924.11
Частица4.454.284.264.184.25
Местоим. нареч.1.481.421.671.421.52
Числит.0.650.620.570.600.74
Числит-прилаг.0.180.180.170.160.18
Междомет.0.080.080.070.070.08
Часть комп.
сложн. слова
0.000.000.000.000.01

Номер слова в предложении
1112131415
Сущ.27.1127.1926.9127.2527.15
Глаг.19.2918.8719.0718.7018.55
Мест.-сущ.8.968.979.149.098.81
Предл.12.2912.6512.7812.2812.48
Союз8.839.008.839.009.08
Прилаг.6.866.867.126.987.49
Нареч.5.715.445.565.645.61
Местоим-прилаг.4.084.093.984.234.05
Частица4.494.684.174.484.35
Местоим. нареч.1.441.441.551.551.50
Числит.0.610.550.580.530.67
Числит-прилаг.0.210.190.180.160.17
Междомет.0.120.070.090.120.09
Часть комп.
сложн. слова
0.000.000.000.000.01