Лингвистический анализ: 100 знаменитых американцев (Дмитрий Таболкин)


- 100 знаменитых американцев (а.с. 100 знаменитых) 4.58 Мб, 792с. скачать: (fb2) (исправленную)  читать: (полностью)  - Дмитрий Таболкин

Общая статистика

Длина текста1425063 знаков
Длина диалогов4402 знаков
Слов в произведении (СВП)199592 слов
Приблизительно страниц792 стр.
Средняя длина слова5.82 знаков
Предложений в произведении (ПВП)14336 предл.
Средняя длина предложения (СДП)96.42 знаков
Доля диалогов в тексте0.31 %
Доля авторского текста99.69 %
СДП диалогов94.72 знаков
СДП авторского текста96.98 знаков
Использование диалогов по тексту книги № 282281: 100 знаменитых американцев (Дмитрий Таболкин)
Максимальный фрагмент авторского текста - 398513 знаков (в страницах - примерно 221, начинается где-то с 442 страницы)

Активный словарный запас

Использовано уникальных слов40450
Активный словарный запас (АСЗ)38557
Активный не словарный запас (АНСЗ)1893
Удельный АСЗ на 3000 слов текста1689.86306292 место в рейтинге УАСЗ-3000
Удельный АСЗ на 10000 слов текста4609.98277902 место в рейтинге УАСЗ-10000
Удельный АСЗ на 100000 слов текста25831.5455838 место в рейтинге УАСЗ-100000
Удельный АСЗ-3000 книги № 282281: 100 знаменитых американцев (Дмитрий Таболкин)
Максимальный УАСЗ-3000 (1808) наблюдается примерно на 726 странице
Минимальный УАСЗ-3000 (1546) наблюдается примерно на 206 странице
Рост АСЗ книги № 282281: 100 знаменитых американцев (Дмитрий Таболкин)

Буквы и знаки препинания

Всего букв1160443 букв
Всего знаков препинания36551 знаков

ЗнакКол-во (шт.)Средн. кол-во на 1000 слов (шт.)
, 1761388.25
. 1485874.44
- 200310.04
? 1200.60
! 1560.78
... 00.00
!.. 110.06
?.. 30.02
!!! 00.00
?! 40.02
" 00.00
() 7583.80
: 9144.58
; 1110.56
БукваКол-во (шт.)Частота использования (в %)
А913167.87
Б190901.65
В520934.49
Г220651.90
Д349973.02
Е-Ё997958.60
Ж220651.90
З192861.66
И-Й1044709.00
К372993.21
Л576544.97
М388403.35
Н786776.78
О12468610.74
П322502.78
Р598805.16
С634245.47
Т669325.77
У271992.34
Ф41960.36
Х99940.86
Ц54200.47
Ч148741.28
Ш78030.67
Щ37870.33
Ь-Ъ201791.74
Ы207671.79
Э46750.40
Ю78140.67
Я199861.72
Диаграма использования букв книги № 282281: 100 знаменитых американцев (Дмитрий Таболкин)

Части речи

Определенных частей речи (ОЧР)198863 слов
Не определенных частей речи (НОЧР)729 слов

Часть речиКол-во (шт.)% в тексте (ОЧР - 100%)
Сущ.7318936.804
Глаг.1197014.822
Мест.-сущ.119706.019
Предл.2055212.106
Союз136747
Прилаг.2055210.335
Нареч.82394.143
Местоим-прилаг.82884.168
Частица53292.680
Местоим. нареч.17910.901
Числит.12260.617
Числит-прилаг.8820.444
Междомет.850.043
Часть комп.
сложн. слова
870.044

Биграммы частей речи

В таблице показаны частоты словопар типа «сглагол+уществительное», «предлог+прилагательное» и т.д. Частота выражена в среднем количестве пары на 1000 слов текста. Вертикаль отражает часть речи первого слова биграммы, горизонталь — второго.

Сущ.Глаг.Мест.-сущ.Предл.СоюзПрилаг.Нареч.Местоим-прилаг.ЧастицаМестоим. нареч.Числит.Числит-прилаг.Междомет.Часть комп.
сложн. слова
Сущ.114.1962.8617.8459.4540.9329.2715.2513.477.434.381.241.290.260.18
Глаг.37.3915.8011.4333.169.4317.908.107.474.301.141.150.880.020.04
Мест.-сущ.14.1919.512.014.214.134.834.271.444.230.780.250.330.020.00
Предл.68.381.4914.080.700.5519.750.8011.670.130.092.141.200.050.05
Союз18.4411.796.417.312.837.935.293.313.651.130.350.240.060.02
Прилаг.79.472.911.323.684.838.670.840.670.420.290.150.060.030.02
Нареч.4.2514.672.365.452.754.722.971.182.270.370.380.060.000.00
Местоим-прилаг.19.654.542.343.070.996.391.521.061.490.230.100.290.010.01
Частица3.4112.121.122.790.671.761.731.031.410.470.210.060.000.00
Местоим. нареч.0.942.181.080.731.400.500.540.191.330.110.010.010.000.00
Числит.4.580.170.100.160.130.670.080.110.010.010.150.020.000.00
Числит-прилаг.2.650.180.090.310.110.840.030.070.110.010.050.000.000.00
Междомет.0.160.010.020.040.010.020.020.010.020.000.000.010.000.13
Часть комп.
сложн. слова
0.340.000.000.010.000.090.000.000.000.000.000.000.000.01

Части речи на позициях в предложении

Таблица показывает, с какой частотой употреблены автором различные части на позициях в предложении. Например, ячейка «глагол – 3» показывает с какой вероятностью третье слово в случайно взятом предложении произведения является глаголом. Вероятность выражена в процентах. В каждом столбце максимальное значение отмечено розовым цветом, что позволяет по первым трём-пяти столбцам примерно представить типичное для произведения начало предлоджения. Например, последовательность «местоимение-существительное, глагол, прилагательное, существительное» может быть чем-то вроде «Он срубил старое дерево...»

Номер слова в предложении
12345
Сущ.23.4034.1335.3837.0936.56
Глаг.7.0319.2419.1118.3318.47
Мест.-сущ.11.298.586.816.496.08
Предл.23.519.4010.9011.2111.26
Союз11.334.064.475.155.47
Прилаг.5.797.999.239.9210.14
Нареч.7.614.964.423.754.08
Местоим-прилаг.4.494.843.903.673.53
Частица2.193.753.572.632.76
Местоим. нареч.2.191.130.670.540.56
Числит.0.381.010.680.710.62
Числит-прилаг.0.710.850.800.400.38
Междомет.0.050.020.020.050.03
Часть комп.
сложн. слова
0.020.040.040.040.06

Номер слова в предложении
678910
Сущ.35.4336.3936.2535.5835.94
Глаг.16.6215.2615.2515.1714.54
Мест.-сущ.4.855.345.164.895.36
Предл.12.7411.7812.0413.0111.62
Союз6.837.017.407.958.20
Прилаг.10.8511.7111.7411.3811.61
Нареч.4.183.783.683.613.76
Местоим-прилаг.4.014.193.844.084.16
Частица2.732.652.722.642.93
Местоим. нареч.0.660.820.890.750.88
Числит.0.590.600.590.480.66
Числит-прилаг.0.440.420.420.380.24
Междомет.0.000.040.000.040.07
Часть комп.
сложн. слова
0.070.020.030.030.03

Номер слова в предложении
1112131415
Сущ.35.8734.7033.9935.6035.11
Глаг.14.2815.1114.3614.0414.37
Мест.-сущ.5.585.465.445.115.42
Предл.12.8012.1413.0312.1613.08
Союз7.407.627.868.117.13
Прилаг.10.8611.6911.6812.2912.08
Нареч.3.674.113.883.623.29
Местоим-прилаг.4.654.495.404.264.68
Частица2.812.612.282.722.69
Местоим. нареч.0.830.940.760.941.10
Числит.0.680.680.840.750.58
Числит-прилаг.0.410.370.340.350.34
Междомет.0.040.030.060.030.06
Часть комп.
сложн. слова
0.110.040.060.020.07